湖南大学《我们该如何看待DeepSeek——what, how, why, and next》.pdf (文末有完整版下载地址)

204 阅读3分钟

大家好,我是吾鳴。

今天给大家分享一份由湖南大学出版的DeepSeek教程——《我们该如何看待DeepSeek——what, how, why, and next》。教程一共有82页PPT,个人觉得讲得还是很深刻的,在此分享给大家,文末有完整版下载地址。

这份教程的大纲主要包含What、How、Why和Next,我对这份教程的大纲做个简单的介绍。

  • DeepSeek是什么?

从ChatGPT的突破谈起,引出DeepSeek-R1的独特价值,包括其作为首个展示思维链的推理模型、价格优势(大幅降低使用成本)、开源特性(支持本地部署)、纯国产技术创新及性能领先。重点强调其通过高效训练框架和推理优化,使大模型技术普及化,推动“量变引发质变”,例如7天用户破亿的爆发性增长。

  • 我能用DeepSeek干什么?

通过编译原理书稿案例生成、数据分析、编程辅助(如抽签程序)、教辅设计等实例,展示其在文本生成、逻辑推理、代码编写等领域的广泛用途。同时明确其局限性:非通用人工智能(AGI),依赖用户拆解任务;存在上下文长度限制;无法直接处理多模态数据;需结合外部工具(如知识库、联网搜索)提升结果可靠性。强调“正确理解能与不能”是高效使用的关键。

  • DeepSeek背后的原理

技术层面,以Transformer架构为基础,详解Embedding(词向量编码)、Attention(上下文关联计算)、MLP(语义理解)等核心机制,以及模型通过海量数据预训练和参数调优实现“文字接龙”的生成逻辑。发展历程方面,梳理DeepSeek从早期跟随LLaMA开源模型到自主创新(如MLA架构、MoE混合专家模型)的演进,突出其在模型结构优化(如降低训练成本42%)、推理效率提升(如显存占用减少93%)上的突破。

  • 下一步要关注什么?

预测大模型生态将因技术普及迎来爆发,需重点关注五大层级:

    • 算力底座:国产AI芯片的性能突破与高性能互连技术;
    • 系统软件:推理引擎、训练框架的快速迭代与人才培养;
    • 模型算法:开源策略推动创新,应对硬件限制(如NV禁令)催生技术革新;
    • 公共平台:知识库服务、API接口整合等中间层创业机会;
    • 行业应用:医疗、教育、政务等场景的深度落地,实现“普通用户解放脑力劳动”的终极目标。文末呼吁开放合作,聚合全球智慧推动技术发展。

好了,吾鳴也不一一列举了,感兴趣的朋友可以按照下面的方式自取。

PDF下载地址:pan.quark.cn/s/7380eff83…

往期精彩

《DeepSeek从入门到精通》——清华大学

《DeepSeek如何赋能职场应用》——清华大学

《普通人如何抓住DeepSeek的红利》——清华大学

《DeepSeek+DeepResearch:让科研像聊天一样简单》——清华大学

《DeepSeek与AI幻觉》——清华大学

《DeepSeek原理与效应》——天津大学

《大模型概念、技术与应用实践》——厦门大学

《DeepSeek与AIGC应用》——北京大学

《DeepSeek提示词工程和落地场景》——北京大学