第四期书生大模型实战营 - 基础岛闯关作业1 - 书生大模型全链路开源体系

186 阅读2分钟

书生·浦语

书生·浦语大模型开源开放体系_哔哩哔哩_bilibili


1. 大模型的发展背景:

  • 大模型已成为发展通用人工智能的重要途径。从本世纪初至2021-2022年,研究主要集中在专用模型上,针对特定任务采用特定模型。然而,近两年趋势转向发展通用大模型,即一个模型应对多种任务和模态。

2. 书生浦语大模型

image.png

  • 书生浦语大模型是一个全链条的开源体系,支持长达100万汉字的输入,是全球大模型产品中支持的最长上下文输入长度。模型具备超长上下文能力、推理数学代码能力、对话和创作体验,以及工具调用能力。

3. 开源历程:

  • 书生浦语大模型自发布以来,经历了快速迭代。包括升级千亿参数大模型、支持8K语境、推出全免费商用的7B开源模型和全链条工具体系、发布多模态预训练语料库、升级对话模型等。

image.png

image.png

  • 核心理念: 回归语言建模的本质

4. 书生浦语2.5的优势

image.png

  • 推理能力提升20%,同量级领先 image.png
  • 支持高达100万tokens长度,遥遥领先于GPT4o.
  • 实现基于规划和搜索解决复杂问题 image.png

5. 全链条开源

  • 历时一年多实现全链条开源,同时与社区生态无缝连接.
  • 包括数据集、预训练框架、微调框架、部署解决方案、评测体系和应用等。这些工具支持从数据准备、模型训练、微调、部署到评测的整个过程,旨在帮助开发者和研究者更容易地使用和开发大模型应用。 image.png

5.1 数据处理工具箱

image.png

5.2 预训练InternEvo

image.png

5.3 高效微调框架XTuner

image.png

5.4 OpenCompass评测体系

  • 大模型评测国标主要参与单位
  • 头部企业在发布大模型时都会用OpenCompass进行评测,获得了Meta官方推荐,唯一国产大模型评测体系。 image.png

5.5 LMDeploy部署

image.png

5.6 应用: 智能体框架Lagent

image.png

5.7 应用: 思索式开源搜索MindSearch

image.png

5.8 应用: 茴香豆

image.png