大家好,我是吾鳴。
今天吾鳴要给大家分享一份由中国联通出品的DeepSeek报告,报告从DeepSeek介绍、中美在AI领域的现状及对比,主流的大模型与AI工具、大模型的应用场景以及大模型使用建议等5个部分展开。报告一共37页PPT,文末有完整版下载地址。
内容摘要
- DeepSeek介绍
概述DeepSeek公司的背景、发展历程及核心产品。公司成立于2023年,隶属幻方量化旗下,专注于大模型研发。主要产品包括对标GPT-4o的DeepSeek-V3(基于混合专家架构MoE,参数量671B,训练成本低于同类模型)和DeepSeek-R1(强化学习优化,推理能力突出)。技术亮点涵盖多头潜在注意力机制(MLA)、多token预测(MTP)等,模型性能国际领先,开源策略冲击行业格局。 - 中美在AI领域的现状及对比
从人才、技术、企业、芯片、大模型五方面对比中美差异。中国在人才数量、原创成果、企业市值、芯片生态方面落后于美国,但通过DeepSeek等模型缩小了技术差距。美国企业主导GPU市场(如英伟达),中国昇腾芯片逐步追赶;大模型领域中美平分秋色,DeepSeek-R1成为最佳开源模型。美国因技术竞争压力拟加强对华芯片管制,如《2025脱钩法案》。 - 主流大模型与AI工具
分类列举国内外主流大模型及工具。国内以“七小虎”(DeepSeek、智谱、MiniMax等)和互联网公司(阿里、百度、腾讯)为主,国外包括OpenAI、Google、Meta等。通用AI助手如DeepSeek、豆包、ChatGPT,其他工具涵盖AI搜索(夸克、秘塔)、生成工具(可灵AI、MidJourney)等,并附各工具链接。 - 大模型的应用场景
详述大模型在多个领域的落地案例:政务热线(辽宁12345工单效率提升30%)、政府经济决策(北京发改委AI分析工具)、公安(视频侦查效率优化)、医疗(中山三院私域GPT)、船舶设计(参数识别与建模)、大飞机运维(RAG技术文档处理)、文博文创(国家博物馆数字互动)等,体现大模型在B端和C端的多样化赋能。 - 大模型使用建议
分析大模型的局限性并提出应对策略。局限性包括幻觉问题(生成不实内容)、算力消耗高、知识更新滞后、偏见与隐私风险。建议用户验证输出、开启联网搜索(RAG)、避免敏感问题、掌握提示词技巧以激发模型潜力。同时强调工程化适配(如多模型协同、算力优化)对实际应用的重要性。