Datawhale组队学习-大语言模型-day1开营仪式第一次参与组队学习，浅浅记录一下。微信小群里，助教同学先介绍

开营仪式

第一次参与组队学习，浅浅记录一下。

微信小群里，助教同学先介绍了一下流程，没有组队的同学还可以现场组一下。

正式的视频开营仪式是本次学习的教材编写团队为大家带来的导学内容（现场抽同款书籍哦，虽然非酋没中┭┮﹏┭┮）。

敲黑板划重点！配套的书侧重系统介绍技术的脉络（内容相对严谨），课件补充了当下热点技术（时效性强），建议互相补充。

Q&A环节主要回答了同学对于技术发展趋势的疑问。

WeChatAppEx.exe_20250311_203557.png

up准备第一种先快速过一遍，建立框架，第二周拓展理解算法原理。

语言模型的发展。课程主要介绍1990s以来的4个主要阶段：统计语言模型、神经语言模、预训练语言模型、大语言模型。注意语言的特点，上下文关联比图像强，根据前面说的话可以预判后面说的话，正如打字法的自动补全功能。
大模型技术基础。主要介绍训练阶段，分预训练、后训练。有点“修学储能，博而后渊”的感觉这点和人很像。还有两个定理：扩展定理和涌现定理，有点类似量变引起质变。
GPT和Deepseek发展历史比较。当前的成功除了deepseek本身性能的优势令人瞩目外，更是开源对闭源的胜利，我们的学习活动也是希望能够通过开源降低大家学习前沿科技的的门槛。