大模型的10个关键思考

186 阅读3分钟

本文内容分享了关于大模型的10个重要思考,旨在为大家提供启发和借鉴。

1. 算力是关键门槛
大模型的发展需要强大的算力支持,过去10年中,算力的增长速度惊人。以NVIDIA为代表的芯片公司借助AI的崛起市值飙升,马斯克甚至计划建立一个由10万块H100显卡组成的超级计算集群。一句话概括:“讲卡伤感情,没卡没感情。”

2. 数据的极限与新需求
大模型的训练依赖大量数据,但互联网可用的优质数据有限。GPT-4的训练数据量约为20TB,而未来的GPT-5可能需要200TB的数据支持。为了突破数据瓶颈,未来可能需要更多多模态数据和人工合成的数据。

3. 大模型的未来方向
未来的大模型将从语言模型(如ChatGPT)向多模态模型(如GPT-4)和具身智能(如机器人)发展。尤其是多模态的“理解和生成统一”是未来的关键方向。机器人、自动驾驶等技术也被视为推动这一趋势的核心领域。

4. 人工智能的范式转变
大模型的训练范式正在改变,OpenAI的最新模型o1展示了“推理阶段的自主学习”新路径。这一思路类似人类的“草稿式思维”,即在推理中多次尝试、纠错和优化。这个过程与以往的“预训练大模型”大不相同。

5. 大模型在各行各业的应用
大模型不只是“通用”模型的天下,行业大模型的比重正在逐渐上升。大模型的发展路径是“从通用到行业”,如金融、医疗等行业模型的定制化微调,这一趋势在中国尤其明显,行业大模型的占比已达70%。未来,企业和个人可能拥有“专属的AI助手”,帮助处理个性化需求。

6. AI Agent的崛起
超级AI Agent(超级助理)将成为大模型落地的重要形式。这种“数字大脑”将能拆解任务、执行操作、辅助决策,并成为日常工作和生活中的重要帮手。沈向洋回忆起与比尔·盖茨共事时对“超级助理”的畅想,如今这一愿景正在逐步实现。

7. 开源与闭源的博弈
大模型的开源和闭源之间的竞争日益激烈。Meta的Llama模型被称为“开源模型”,但其实并未完全开源(没有提供源代码和数据)。沈向洋提醒大家要警惕“伪开源”,并认识到真正理解大模型系统背后的工作原理至关重要。

8. AI治理的重要性
AI的快速发展对社会各行各业产生巨大冲击,AI的治理问题不容忽视。未来的AI治理将涉及安全性、伦理性和法律法规等方面,需要政府、企业和社会的多方协作。

9. 重新定义人机关系
人工智能的“人机交互”正在重新定义技术的商业价值。以ChatGPT为代表的“对话式AI”模式,使人与AI的互动更加自然。未来,能够掌控人机交互核心技术的企业,将在高科技产业中占据更有利的地位。

10. 对“智能本质”的探索
尽管大模型表现出强大的智能涌现现象,但其背后的理论支撑仍然薄弱。相比物理学中的公式和定律,AI涌现智能的本质仍不清晰。解释AI的“涌现现象”需要更多的数学和科学研究。