[学习笔记] 书生·浦语大模型全链路开源体系

308 阅读2分钟

课程视频

手动截图还有手打的标题,这样方便搜索到具体的哪一张 PPT。

大模型成为热门关键词

有多热门,ChatGPT 是破亿应用里速度超过 Tiktok 的那个。

image.png

大模型成为发展通用人工智能的重要途径。

模型主要的输入和输出都是文本的形式,GPT 4 现在也可以把图片,语音,文档等作为输入和输出。模型处理的任务不再是单一的某一个问题,而是更复杂的问题。

image.png

书生·浦语大模型开源历程

image.png

书生·浦语大模型系列

image.png

书生·浦语 20B 开源大模型性能

这个表格和这张图想表达的意思是从实验结果来看不大不小的模型规模能跟最大规模的模型叫板,实验细节自己去看论文。

image.png

从模型到应用

image.png

上图里问号的过程是下图里的流程。

image.png

三个判断分支的意思换成人话就是:

  1. 大模型原本的本领够不够高(不够高,就和毕业生一样要入职培训)
  2. 你们的预算有多少(已经确定要培训了,是让它边学边干还是脱产培训,培训多久)
  3. 让大模型干活,你需要放开多少权力(招一个碧桂园五星上将,也得给他发一把大门的备用钥匙,教会他如何开门如何锁门不要把业主挡在外面不要让外卖小哥进小区)
书生·浦语全链条开源开放体系

这后面主要介绍的体系内的工具全是为了选型服务的,用了 InternLM 的大模型,再用这些工具,更方便走完上面的流程。

image.png

全链条开源开放体系 | 数据

image.png

image.png

全链条开源开放体系 | 预训练

image.png

全链条开源开放体系 | 微调

image.png

image.png

image.png

全链条开源开放体系 | 评测

image.png

image.png

image.png

image.png

OpenCompass 也是 Meta 推荐的一个由国内开发者发布的评测体系。

image.png

image.png

全链条开源开放体系 | 部署

image.png

turbomind 是基于 faster transformer 魔改的推理引擎

image.png

image.png

全链条开源开放体系 | 智能体

image.png

image.png

image.png

image.png

全链条开源开放体系:工具合集