相关课程资料:
课程:第一节课
日期:2024.03.28
主题:浦语大模型全链路开源体系
视频链接: 课程链接
课堂重点
-
大模型的发展历程
- 由专用模型(针对特定任务,一个模型解决一个问题)-> 通用大模型(一个模型应对多个任务、多种模态)
- 通用大模型是通往通用人工智能的关键途径
-
书生浦语大模型的开源历程
- 2023年6月 InternLm 千亿语言大模型发布,到7月升级开源
- 8月书生万卷多模态模型发布,升级对话模型,Lagent发布,参数量升级至123B
- 9月20B开源
- 2024年 InternLm2 发布
-
InternLm2 体系
-
InternLm2 特点和优势
- 超长上下文处理能力、优秀的对话和创作体验、强大的工具调用能力和出色的数理分析能力
- 通过与其他同类产品的对比,性能全方位提升,突出了书生葡语大模型的优势地位
- 模型创作富有想象力,举例展示了模型在各种应用场景下的表现,例如提供旅行计划建议、给予富有同情心的人工智能助手的回答等
- 工具调用能力升级,工具复合调用完成复杂任务
- 内在的计算能力强大,同时还能借助代码解释器,提升计算能力
-
从模型到应用的流程
-
书生浦语的全链条开源开放体系
- 详细讲解各个链路的方案内容和优势
- “书生万卷”的多模态数据集
- 预训练的大规模开源框架IntelTrain及其相关工具箱
- 微调框架XTa和高效的微调框架EXTUNA
- 全流程部署解决方案IM Deploy
- Open Compass评估系统的设计理念、组成结构以及其在大模型评测中的应用情况
- Lagent 轻量级的智能体框架,支持多种形式的人工智能,灵活、可拓展
开源是推动技术创新的重要手段,也能有效地促进全社会的技术进步和发展。