大家好,我是吾鳴。
今天吾鳴要给大家分享的是由东方证券出版的DeepSeek报告——《DeepSeek惊艳世界,算力与应用将迎来结构性变化》。这份报告主要从DeepSeek性能与市场反响、技术创新解析、算力与应用的潜在影响、投资建议和风险提示这几大部分对DeepSeek做了全面的介绍。报告是一份PDF电子书,一共有18页,内容很丰富。
内容摘要
1. 引言
概述DeepSeek近期发布的大模型DeepSeek-V3和推理模型R1,强调两者在性能(如开源模型榜首、对标顶尖闭源模型)和成本(大幅降低训练与推理成本)上的突破,并指出其开源属性与技术创新将对AI算力及应用行业产生深远影响。
2. DeepSeek模型性能与市场反响
- DeepSeek-V3:在知识类、长文本、代码和数学任务评测中超越主流开源模型(如Llama-3.1-405B),并与GPT-4o、Claude-3.5-Sonnet等闭源模型性能相当;通过FP8精度训练等技术降低训练成本至557万美元(仅为同类模型的1/10),API定价显著低于市场水平。
- R1模型:强化学习驱动,推理能力对标OpenAI o1,支持蒸馏小模型(如32B/70B)实现高性能;API服务定价仅为OpenAI的1/4,上线后全球下载量飙升,18天日活突破1500万。
- 行业反响:引发科技巨头(微软、Meta、ASML等)高度关注,英伟达等芯片厂商股价因算力需求预期变化大幅下跌。
3. 技术创新解析
- 训练技术:采用FP8混合精度训练(降低计算资源消耗)、DualPipe双向流水线(提升并行效率)、跨节点通信优化(减少通信开销)。
- 推理优化:通过MoE架构(仅激活部分参数)和多头潜在注意力(MLA) 降低推理成本,结合 多Token预测(MTP) 和 模型蒸馏提升性能。
- 强化学习应用:R1-Zero验证纯强化学习的推理潜力,R1通过多阶段训练(冷启动→强化学习→拒绝采样→全场景优化)实现实用化推理模型。
4. 对算力与应用的潜在影响
- 算力需求结构性变化:训练端因算法优化可能减少短期投入,但长期仍将追求更大模型;推理端因成本下降(“杰文斯悖论”)需求激增,国产芯片(如华为昇腾、海光DCU)或受益于生态适配与政策限制。
- AI应用普及加速:高性能、低成本模型推动B端企业应用(如办公、医疗、金融)、垂直行业工具(如代码、多模态)及国产算力服务商的商业化落地,中国AI应用全球竞争力提升(如豆包、Kimi助手)。
5. 投资建议
建议关注四大方向:
- B端企业应用(金山办公、泛微网络等);
- 垂直行业龙头(科大讯飞、同花顺等);
- AI工具类(万兴科技、福昕软件等);
- 国产算力及服务(海光信息、中科曙光等)。
6. 风险提示
- 技术落地不及预期;
- 政策支持力度不足;
- 美国芯片制裁加剧;
- 行业竞争导致变现能力下降。
报告精彩
报告无套路下载地址:pan.quark.cn/s/7380eff83…