书生大模型课堂笔记 - 第一节课

163 阅读2分钟

相关课程资料:

课程:第一节课

日期:2024.03.28

主题:浦语大模型全链路开源体系

视频链接: 课程链接

课堂重点

  1. 大模型的发展历程

    • 由专用模型(针对特定任务,一个模型解决一个问题)-> 通用大模型(一个模型应对多个任务、多种模态)
    • 通用大模型是通往通用人工智能的关键途径
  2. 书生浦语大模型的开源历程

    • 2023年6月 InternLm 千亿语言大模型发布,到7月升级开源
    • 8月书生万卷多模态模型发布,升级对话模型,Lagent发布,参数量升级至123B
    • 9月20B开源
    • 2024年 InternLm2 发布
  3. InternLm2 体系

image.png

  1. InternLm2 特点和优势

    • 超长上下文处理能力、优秀的对话和创作体验、强大的工具调用能力和出色的数理分析能力
    • 通过与其他同类产品的对比,性能全方位提升,突出了书生葡语大模型的优势地位
    • 模型创作富有想象力,举例展示了模型在各种应用场景下的表现,例如提供旅行计划建议、给予富有同情心的人工智能助手的回答等
    • 工具调用能力升级,工具复合调用完成复杂任务
    • 内在的计算能力强大,同时还能借助代码解释器,提升计算能力
  2. 从模型到应用的流程

image.png

  1. 书生浦语的全链条开源开放体系

    • 详细讲解各个链路的方案内容和优势
    • “书生万卷”的多模态数据集
    • 预训练的大规模开源框架IntelTrain及其相关工具箱
    • 微调框架XTa和高效的微调框架EXTUNA
    • 全流程部署解决方案IM Deploy
    • Open Compass评估系统的设计理念、组成结构以及其在大模型评测中的应用情况
    • Lagent 轻量级的智能体框架,支持多种形式的人工智能,灵活、可拓展

image.png

开源是推动技术创新的重要手段,也能有效地促进全社会的技术进步和发展。