[240724] Meta 发布全新大语言模型 Llama 3.1 | Apple 开源全新 AI 模型，打造高效 AI 生态

Meta 发布全新发语言模型 Llama 3.1

Llama 3.1 提供 8B、70B 和 405B 三种参数规模，其中 405B 版本在通用知识、可控性、数学、工具使用和多语言翻译方面均达到业界领先水平。

升级后的 8B 和 70B 模型支持多语言，上下文长度扩展至 128K，具备先进的工具使用能力和更强的推理能力，可用于长文本摘要、多语言对话代理和编码助手等场景。

Meta 还更新了许可协议，允许开发者使用 Llama 模型（包括 405B 版本）的输出改进其他模型。

Llama 3.1 的主要优势：

三种参数规模，满足不同需求
405B 版本性能媲美 GPT-4 等顶级模型
升级后的 8B 和 70B 模型支持多语言和更长上下文
具备先进的工具使用能力和更强的推理能力
许可协议更加开放

Llama 3.1 的应用场景：

长文本摘要
多语言对话代理
编码助手

模型评估：

ollama3.1-01.png

ollama3.1-02.png

ollama3.1-03.png

Meta 通过 150 多个基准数据集和大量人工评估，验证了 Llama 3.1 的性能优势。实验结果表明，Llama 3.1 在各种任务上均具有竞争力，其旗舰模型可与 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 等领先基础模型相媲美。

终端用户可通过命令行方式获取相关模型：

# 安装 ollama
x ollama install

# 运行 Llama3.1 模型
x ollama run llama3.1:latest

# 查看本地已下载的模型
x ollama ls

使用案例：

ollama 3.1.png

来源：
ollama.com/library/lla…

Apple 开源全新 AI 模型，挑战 Meta，打造高效 AI 生态

苹果公司最近开源了其最新的70亿参数人工智能模型 DCLM，加入开源AI运动并挑战 Meta 等巨头。

这款模型虽然规模不大，但性能优异，在基准测试中表现超越 Meta 的 Mistral-7B，并接近谷歌同等规模模型。更重要的是，DCLM 模型的权重、训练代码和数据集全部开源，任何人都可以使用或改编，这与 Meta 即将发布的4000亿参数 Llama 3 形成鲜明对比。

苹果开发 DCLM 模型的目标是创建一个高效且高质量的数据集，并通过开源方式推动更广泛的 AI 生态系统建设。该模型训练使用的内容标记更少，但效率更高，性能与同等规模的其他模型相当。

苹果此举意义重大，它不仅为研究人员和公司提供了创建小型 AI 的机会，也为构建更加开放和透明的 AI 未来迈出了重要一步。正如 OpenAI 首席执行官萨姆·奥尔特曼所说，目标是创造出便宜到可以计量的智能，而苹果的开源模型正是这一理念的体现。

终端用户可通过命令行方式获取相关模型：

# 设置在全局环境中使用 huggingface-cli
x env use huggingface

# 从 HuggingFace Hub 下载 apple/DCLM-7B 模型
huggingface-cli download apple/DCLM-7B

# 扫描缓存目录，查看模型的相关信息
huggingface-cli scan-cache

来源：

更多内容请查阅 : blog-240724

关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法