Llama 3 解析,2024 年完整指南

359 阅读7分钟

了解如何访问 Meta 的新 AI 模型 Llama 3,该模型的独特之处在于可以根据许可协议开放使用。

好处缺点
开放模型可以根据您的业务进行定制。Meta 使用公开信息对 Llama 3 进行训练,因此与其他生成式人工智能一样,这可能会产生有害内容或违反版权法。
生成文本或图像,尤其是使用 Imagine 功能可以快速迭代图像。在我们的测试中,Llama 3 生成的专业电子邮件与使用 GPT-3.5 的 ChatGPT 编写的电子邮件相比,往往有些模糊和空洞。
与您现有的云提供商一起使用。与其他生成式 AI 一样,如果您计划定制模型,训练 Llama 3 可能会耗费大量时间和资源。

在商业生成 AI 领域,OpenAI 可能更为知名,但 Meta 已通过开源强大的大型语言模型成功占据一席之地。4 月 18 日,Meta 发布了迄今为止最大的生成 AI 模型 Llama 3,该模型在一些标准 AI 基准测试中的表现优于 GPT-4。

什么是 Llama 3?

Llama 3 是 Meta 创建的 LLM。它可用于创建生成式 AI,包括能够以自然语言响应各种查询的聊天机器人。Llama 3 的评估用例包括集思广益、创意写作、编码、总结文档以及以特定角色或人物的声音回答问题。

完整的 Llama 3 型号有四种变体:

· 已预先训练 80 亿个参数。

· 80亿个参数指令微调。

· 已预先训练 700 亿个参数。

· 700亿个参数指令经过微调。

Llama 3 的生成式 AI 功能可在浏览器中使用,也可通过 Meta 的 Facebook、Instagram、WhatsApp 和 Messenger 中的 AI 功能使用。模型本身可从 Meta 或各大企业云平台下载。

Llama 3 何时发布?在哪些平台上发布?

Llama 3 于 4 月 18 日在 Google Cloud Vertex AI、IBM 的 watsonx.ai 和其他大型 LLM 托管平台上发布。AWS 紧随其后,于 4 月 23 日将 Llama 3 添加到 Amazon Bedrock。截至 4 月 29 日,Llama 3 已在以下平台上可用:

· Databricks.

· Hugging Face.

· Kaggle.

· Microsoft Azure.

· NVIDIA NIM.

AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 的硬件平台均支持 Llama 3。

Llama 3 是开源的吗?

Llama 3 是开源的,就像 Meta 的其他 LLM 一样。创建开源模型一直是 Meta 的一大优势。

关于大型语言模型的代码或权重需要公开多少才算开源,存在一些争议。但就商业目的而言,Meta 对 Llama 3 的开放程度比其竞争对手的 LLM 更为开放。

Llama 3 免费吗?

只要按照许可条款使用,Llama 3 就是免费的。该模型可以直接从 Meta下载,也可以在上面列出的各种云托管服务中使用,但这些服务可能需要付费。

 

浏览器上的 Meta AI 起始页提供了让 Llama 3 执行哪些操作的选项。图片:Meta / Megan Crouse 的截图

Llama 3 是多式联运吗?

Llama 3 不是多模态的,这意味着它无法理解来自视频、音频或文本等不同模态的数据。Meta 计划在不久的将来让 Llama 3 成为多模态的。

Llama 3 相对于 Llama 2 的改进

为了让 Llama 3 比 Llama 2 更强大,Meta 添加了一个新的标记器,以便更有效地对语言进行编码。Meta 为 Llama 3 添加了分组查询注意功能,这是一种提高模型推理效率的方法。Meta 表示,Llama 3 训练集的大小是 Llama 2 训练集的七倍,代码量是 Llama 2 的四倍。Meta 为 Llama 3 的预训练和指令微调应用了新的效率。

由于 Llama 3 的设计是开放模型,因此 Meta 为开发人员添加了防护措施。新的防护措施是 Code Shield,旨在捕获该模型可能产生的不安全代码。

Llama 3 的下一步计划是什么?

Meta 计划:

· 为 Llama 3 添加多种语言。

· 展开上下文窗口。

· 总体上增强模型的未来能力。

Meta 正在开发一个 400B 参数模型,这可能有助于塑造下一代 Llama 3。据 Meta 称,在早期测试中,经过指令调整的 Llama 3 400B在 MMLU 知识评估(一项 AI 基准测试)中得分为86.1,与 GPT-4 相媲美。Llama 400B 将是 Meta 迄今为止最大的 LLM。

Llama 3 在竞争激烈的生成式 AI 领域中的地位

Llama 3 与GPT-4和 GPT-3.5、谷歌的 Gemini和 Gemma、Mistral AI 的 Mistral 7B、Perplexity AI 和其他 LLM 直接竞争,可用于个人或商业用途,以构建生成式 AI 聊天机器人和其他工具。在 Llama 3 发布大约一周后,Snowflake 推出了具有类似功能的开放式企业 AI,名为Snowflake Arctic。

Llama 3 等 LLM 的性能要求越来越高,这促使支持 AI的 PC 展开军备竞赛,这些 PC 至少可以部分在设备上运行模型。与此同时,生成式 AI 公司可能会因计算需求过大而面临更严格的审查,这可能会导致气候变化恶化。

Llama 3 与 GPT-4

Llama 3 在 HumanEval 上的表现优于 OpenAI 的 GPT-4,这是一个标准基准,用于比较 AI 模型生成代码的能力与人类编写的代码。Llama 3 70B 得分为 81.7,而GPT-4 得分为 67。

然而,GPT-4 在知识评估 MMLU 上的表现优于 Llama 3,得分为 86.4,而 Llama 3 70B 得分为 79.5。Llama 3 在更多测试中的表现可以在Meta 的博客文章中找到。

您的组织应该使用 Llama 3 吗?

假设您已经决定生成式 AI 适合您的业务,那么选择是否使用 Llama 3 可能取决于可用性。Llama 3 可以免费使用,并且比其竞争对手有更多限制的定制。

Llama 3 在编码方面可能比 GPT-4 或 Claude 3 等竞争对手更有效。然而,Llama 3 在编码领域还有其他竞争对手。例如,GitHub 最近推出了Copilot Workspace,它是为编码而定制的,可以根据自然语言提示创建代码。

如果您想要一个通用的开源 AI 模型系列,那么 Llama 3 可能适合您的组织。

智答专家:国内免费使用GPT4o的AI智能问答工具

分享一个国内免费使用GPT4o的AI智能问答工具:智答专家。支持AI文本、作图、语音、Sora视频。无需魔法,亲测有效,访问链接:t.aizdzj.com/?p=MTAwNzE2…

智答专家是一款强大的AI智能问答工具,它基于GPT4o技术,为用户提供了一个国内免费使用的平台。无论是需要文本生成、图像制作、语音交互还是视频内容的创建,智答专家都能提供支持。这个工具的独特之处在于它集成了多种功能,用户可以在一个平台上完成多种类型的AI交互,极大地提高了工作效率和创造力。

与其他AI聊天机器人相比,智答专家具有以下优势:

多功能集成:  支持文本、图像、语音和视频的生成,满足不同场景的需求。

免费使用:  在国内用户可以直接访问并使用,无需任何额外费用。

用户体验:  界面友好,操作简单,即使是AI新手也能快速上手。

高效准确:  基于GPT4o的强大能力,智答专家能够提供高质量的回答和内容生成。

无论你是一名学生、教师、内容创作者还是企业用户,智答专家都能为你提供强大的AI支持,帮助你在各自的领域内实现更高效、更有创意的工作。不妨试试智答专家,探索AI带来的无限可能。

1920_1080_2.png