网页历史给AI未来的启示

用户576110558132

2026-03-07 4 阅读4分钟

网页历史给AI未来的启示

近期生成式AI的进步令人兴奋，它必将对未来产生重大而未知的影响。我们未来还需要开发者吗？他们会被AI取代吗？大科技公司会垄断这项技术吗？我们会完全依赖API提供商，牺牲开源精神和数据隐私吗？作者认为，我们可以从另一项突破性技术——互联网中学到很多。

从互联网历史中学习

作者分享了自己从2006-2009年学习CSS和网页开发，到如今投身于NLP（自然语言处理）和AI领域的经历。这展现了技术演进的个人视角。

Python在AI领域的成功，恰恰因为它是一门通用语言。 2023年Python开发者调查显示，Python在数据分析、Web开发、机器学习等多个领域都有广泛应用，其通用性是它在AI领域获胜的关键。

大科技公司是在“重新发明轮子和道路”

回顾互联网历史，某中心（原谷歌）凭借搜索、Chrome/Chromium浏览器（驱动着某中心（原微软）Edge、Opera等）、Gemini模型以及广告业务，构建了庞大的生态。他们也曾推动加速移动页面（AMP）等项目。这引发我们思考：大科技公司会垄断AI吗？

我们关心的问题：

我们还需要开发者吗？
大科技公司会垄断AI吗？
开源软件的未来如何？
AI开发者会被AI取代吗？
我们会依赖API提供商吗？
如何保证数据隐私？

核心洞见：不要混淆“抬高地板”和“抬高天花板”

“地板”：指基础、易用的技术。例如，本地商店无需开发者就能建网站（+10%客户）；待办事项App用API增加翻译功能（+5%国际用户增长）。这些是高采纳率的技术，让更多人能完成基本任务。
“天花板”：指高价值、复杂的应用。例如，流媒体服务让网页播放器快1毫秒（+3%使用时长）；酒店预订平台改进推荐系统（+0.5%点击率，+100万美元收入）。这些是高价值的应用，需要开发者进行深度优化。

未来AI的技术栈将包括：网站构建器、框架、浏览器、Web标准、AI功能，而开发者则专注于构建框架、环境和核心技术，以触及更高的天花板。

高价值用例值得投入开发

以某机构（原S&P Global）的案例研究为例：

场景：在高安全环境下，从实时大宗商品交易洞察中提取结构化属性。
方法：在标注过程中使用大语言模型（LLM），通过人机协同，将数据开发速度提升了10倍。
成果：最终部署了8个以上市场管道，模型大小仅6MB，F-Score达到99%，处理速度超过16,000词/秒。

人机协同蒸馏流程

LLM提示：利用LLM进行初步数据标注。
Prodigy工具：在“人机协同”流程中进行持续评估。
组件迁移学习：将LLM的知识蒸馏到更小的组件中。
蒸馏模型：生成更小、更快、更私密的模型。
部署：将优化后的模型投入生产。

这个开发过程让开发者重新夺回控制权。

开发工作流的演进

静态页面 → 动态页面 → 静态页面（构建时编译静态数据）
自定义模型 → 预训练模型 → 蒸馏模型（将模型蒸馏成更小、更快、更私密的组件）

AI产品不止是模型

AI产品的成功不仅取决于技术，更在于产品层面的差异化。

机器 facing 模型：如GPT-4。
人类 facing 系统：如ChatGPT。
关键差异化因素：UI/UX、营销、定制化、速度、准确性、延迟、成本。
可互换组件：基于研究成果，可以量化影响并轻松替换组件（如LLM）。

关于数据：用户数据是产品的优势，而非机器 facing 任务的基础。获取通用知识并不需要特定的数据。互操作性才是垄断的对立面。

结论与启示

对开发者：不要混淆“抬高地板”与“抬高天花板”。高价值用例值得投入精力去开发。
对模型：通过在开发时编译，夺回控制权，构建更小、更快、更私密的模型。
对开源：互操作性是垄断的对立面。LLM可以成为产品或流程中可替换的一部分。
对监管：监管应聚焦于产品和行为，而非技术组件。FINISHED