大家好,我是吾鳴。
今天给大家分享一份由湖南大学出版的DeepSeek教程——《我们该如何看待DeepSeek——what, how, why, and next》。教程一共有82页PPT,个人觉得讲得还是很深刻的,在此分享给大家,文末有完整版下载地址。
这份教程的大纲主要包含What、How、Why和Next,我对这份教程的大纲做个简单的介绍。
- DeepSeek是什么?
从ChatGPT的突破谈起,引出DeepSeek-R1的独特价值,包括其作为首个展示思维链的推理模型、价格优势(大幅降低使用成本)、开源特性(支持本地部署)、纯国产技术创新及性能领先。重点强调其通过高效训练框架和推理优化,使大模型技术普及化,推动“量变引发质变”,例如7天用户破亿的爆发性增长。
- 我能用DeepSeek干什么?
通过编译原理书稿案例生成、数据分析、编程辅助(如抽签程序)、教辅设计等实例,展示其在文本生成、逻辑推理、代码编写等领域的广泛用途。同时明确其局限性:非通用人工智能(AGI),依赖用户拆解任务;存在上下文长度限制;无法直接处理多模态数据;需结合外部工具(如知识库、联网搜索)提升结果可靠性。强调“正确理解能与不能”是高效使用的关键。
- DeepSeek背后的原理
技术层面,以Transformer架构为基础,详解Embedding(词向量编码)、Attention(上下文关联计算)、MLP(语义理解)等核心机制,以及模型通过海量数据预训练和参数调优实现“文字接龙”的生成逻辑。发展历程方面,梳理DeepSeek从早期跟随LLaMA开源模型到自主创新(如MLA架构、MoE混合专家模型)的演进,突出其在模型结构优化(如降低训练成本42%)、推理效率提升(如显存占用减少93%)上的突破。
- 下一步要关注什么?
预测大模型生态将因技术普及迎来爆发,需重点关注五大层级:
-
- 算力底座:国产AI芯片的性能突破与高性能互连技术;
- 系统软件:推理引擎、训练框架的快速迭代与人才培养;
- 模型算法:开源策略推动创新,应对硬件限制(如NV禁令)催生技术革新;
- 公共平台:知识库服务、API接口整合等中间层创业机会;
- 行业应用:医疗、教育、政务等场景的深度落地,实现“普通用户解放脑力劳动”的终极目标。文末呼吁开放合作,聚合全球智慧推动技术发展。
好了,吾鳴也不一一列举了,感兴趣的朋友可以按照下面的方式自取。
PDF下载地址:pan.quark.cn/s/7380eff83…