Meta 刚刚低调发布了一个最小且快速的 LLM大模型训练和推理框架库Meta Lingua。 目的是让更多人来训练 llama。可以 24 小时训练出一个 llama 7B,MMLU达到 48%。在许多下游任务上获得了非常强大的性能,并且与DCLM 基线 1.0的性能相匹配。 #AI

训练一个国产大模型只需要 10 万人民币,费用计算: $2.50/h(租用一个 H100) × 256个(h100 gpu) × 24H = $15,360。

Meta Lingua主要特点 :
- 允许用户快速入门,而无需安装和配置大量依赖项。
- 用于研究的最小且快速的 LLM 训练/推理库。
- 使用可修改的 PyTorch 组件来试验架构、损失、数据
- 支持端到端训练、推理和评估 。
- 代码的模块化使其具有高度可重用性,灵活性,使研究人员能够即插即用各种组件,更快地迭代和验证新概念。

开源项目 Github 地址
 
 
Back to Top