Meta 刚刚低调发布了一个最小且快速的 LLM大模型训练和推理框架库Meta Lingua

Meta 刚刚低调发布了一个最小且快速的 LLM大模型训练和推理框架库Meta Lingua。目的是让更多人来训练 llama。可以 24 小时训练出一个 llama 7B，MMLU达到 48%。在许多下游任务上获得了非常强大的性能，并且与DCLM 基线 1.0的性能相匹配。 #AI

训练一个国产大模型只需要 10 万人民币，费用计算： $2.50/h（租用一个 H100） × 256个（h100 gpu） × 24H = $15,360。

Meta Lingua主要特点：
- 允许用户快速入门，而无需安装和配置大量依赖项。
- 用于研究的最小且快速的 LLM 训练/推理库。
- 使用可修改的 PyTorch 组件来试验架构、损失、数据
- 支持端到端训练、推理和评估。
- 代码的模块化使其具有高度可重用性，灵活性，使研究人员能够即插即用各种组件，更快地迭代和验证新概念。

开源项目 Github 地址