训练一个国产大模型只需要 10 万人民币,费用计算: $2.50/h(租用一个 H100) × 256个(h100 gpu) × 24H = $15,360。
Meta Lingua主要特点 :
- 允许用户快速入门,而无需安装和配置大量依赖项。
- 用于研究的最小且快速的 LLM 训练/推理库。
- 使用可修改的 PyTorch 组件来试验架构、损失、数据
- 支持端到端训练、推理和评估 。
- 代码的模块化使其具有高度可重用性,灵活性,使研究人员能够即插即用各种组件,更快地迭代和验证新概念。
开源项目 Github 地址