DeepSeek的成功对国内巨头的启发很多媒体提到DeepSeek的成功在于不急于商业化，没有营收压力。但是实际上，即使

最近DeepSeek在大语言模型研发领域取得的突破，引发了业内广泛关注。甚至李强都接见了DeepSeek团队，他们的业务成果远超融资和烧钱更多的AI六小龙，以及传统机器学习XX小虎。

Deepseek的成功不仅在于技术上的创新，更在于其独特的发展路径——在初期并未急于商业化，也没有过多受制于营收压力。这一做法让我们重新思考：究竟是什么因素在推动大语言模型的突破？而这种突破，是否也能为国内拥有雄厚资源的互联网企业带来新的启发？

创新与资源：压力与机遇并存

很多人认为，只有在不受商业化压力的环境中，团队才能专注于技术探索。实际上，无论是百度、阿里、腾讯等大企业，还是像达摩院这样的研究机构，其内部的算法团队在早期研发阶段往往都不直接承担营收压力。换句话说，营收并非决定技术创新成败的唯一因素。

DeepSeek的成功告诉我们，资源的“紧缺”反而可能激发出更强的创新动力。资源有限的情况下，团队必须更加注重技术的优化和高效利用，从而发现传统“大投入、大回报”模式之外的新可能。这一现象值得各大企业深思：即便在资源充裕的环境中，如何激发团队的创新活力，同样是一大挑战。

长期以来，国内部分企业在研发大语言模型时，倾向于将所有GPU资源集中在单一团队，认为只有如此才能支撑起庞大的计算需求。这种“集中资源办大事”的模式在逻辑上并无不妥，但实践中也显示出一些局限性。部分企业推出的模型在某些指标上表现尚可，但内部评估往往表明整体效果仍有提升空间。

DeepSeek的研发实践提供了一种全新的视角：通过技术优化，大语言模型的训练成本可以显著降低。据估计，DeepSeek的训练成本不足600万美元，而业内部分预期则在1亿美元甚至更高。这一成果促使人们重新考虑如何更合理地配置GPU资源。

例如，对于拥有上万块显卡资源的企业来说，如果不将所有资源集中于一个团队，而是将其合理拆分为若干个约2000块显卡左右的“资源池”，并由不同团队各自探索和尝试，这不仅有助于分散风险，更可能提高整体成功率。实际上，DeepSeek V3正是在大约2000块显卡的条件下顺利训练完成的。

这种资源拆分与多团队并行探索的模式，不仅适用于科技研发领域，也为其他行业提供了借鉴。以腾讯为例，假设微信团队在早期就能够获得类似规模的GPU资源，或许也能催生出具有突破性的模型；而对于金融、通讯等不同领域的团队来说，通过内部技术优化，同样有机会在各自的应用场景中实现创新突破。

事实上，DeepSeek团队在优化PTX代码、提升计算性能方面所做的努力，正展示了技术细节决定成败的理念。它表明：在技术和产品创新的道路上，成功并不单纯取决于硬件资源的数量，而更依赖于团队对技术瓶颈的深刻理解和突破。

总体来看，DeepSeek的成功为国内外科技企业提供了一个宝贵的案例：在人工智能领域，单一依赖资源优势可能并非最佳发展策略。相反，如何通过多元化资源配置、跨团队协同以及技术细节上的不断突破，更高效地推动创新，才是未来竞争中的关键所在。

随着技术的不断进步和市场环境的变化，这种多元化的研发模式有望在未来几年内得到更广泛的应用。特别是对于拥有丰富计算资源的企业而言，如何平衡资源投入与技术探索、商业化之间的关系，将成为企业在2025年及以后实现持续突破的重要课题。

DeepSeek的成功不仅仅是一次技术上的飞跃，更是对整个行业资源配置和创新模式的一次有益启示。希望这一案例能够激励更多企业和研发团队，不断探索、勇于创新，共同推动人工智能技术迈向新的高度。