[240724] Meta 发布全新大语言模型 Llama 3.1 | Apple 开源全新 AI 模型,打造高效 AI 生态

325 阅读3分钟

Meta 发布全新发语言模型 Llama 3.1

Llama 3.1 提供 8B、70B 和 405B 三种参数规模,其中 405B 版本在通用知识、可控性、数学、工具使用和多语 言翻译方面均达到业界领先水平。

升级后的 8B 和 70B 模型支持多语言,上下文长度扩展至 128K,具备先进的工具使用能力和更强的推理能力,可用于长文本摘要、多语言对话代理和编码助手等场景。

Meta 还更新了许可协议,允许开发者使用 Llama 模型(包括 405B 版本)的输出改进其他模型。

Llama 3.1 的主要优势:

  • 三种参数规模,满足不同需求
  • 405B 版本性能媲美 GPT-4 等顶级模型
  • 升级后的 8B 和 70B 模型支持多语言和更长上下文
  • 具备先进的工具使用能力和更强的推理能力
  • 许可协议更加开放

Llama 3.1 的应用场景:

  • 长文本摘要
  • 多语言对话代理
  • 编码助手

模型评估:

ollama3.1-01.png

ollama3.1-02.png

ollama3.1-03.png

Meta 通过 150 多个基准数据集和大量人工评估,验证了 Llama 3.1 的性能优势。实验结果表明,Llama 3.1 在 各种任务上均具有竞争力,其旗舰模型可与 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 等领先基础模型相媲美。

终端用户可通过命令行方式获取相关模型:

# 安装 ollama
x ollama install

# 运行 Llama3.1 模型
x ollama run llama3.1:latest

# 查看本地已下载的模型
x ollama ls

使用案例:

ollama 3.1.png

来源:
ollama.com/library/lla…

Apple 开源全新 AI 模型,挑战 Meta,打造高效 AI 生态

苹果公司最近开源了其最新的70亿参数人工智能模型 DCLM,加入开源AI运动并挑战 Meta 等巨头。

这款模型虽然规模不大,但性能优异,在基准测试中表现超越 Meta 的 Mistral-7B,并接近谷歌同等规模模型。更重要的是,DCLM 模型的权重、训练代码和数据集全部开源,任何人都可以使用或改编,这与 Meta 即将发布的4000亿参数 Llama 3 形成鲜明对比。

苹果开发 DCLM 模型的目标是创建一个高效且高质量的数据集,并通过开源方式推动更广泛的 AI 生态系统建设。该模型训练使用的内容标记更少,但效率更高,性能与同等规模的其他模型相当。

苹果此举意义重大,它不仅为研究人员和公司提供了创建小型 AI 的机会,也为构建更加开放和透明的 AI 未来迈出了重要一步。正如 OpenAI 首席执行官萨姆·奥尔特曼所说,目标是创造出便宜到可以计量的智能,而苹果的开源模型正是这一理念的体现。

终端用户可通过命令行方式获取相关模型:

# 设置在全局环境中使用 huggingface-cli
x env use huggingface

# 从 HuggingFace Hub 下载 apple/DCLM-7B 模型
huggingface-cli download apple/DCLM-7B

# 扫描缓存目录,查看模型的相关信息
huggingface-cli scan-cache

apple_dclm_model.png

来源:




更多内容请查阅 : blog-240724


关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法