网页历史给AI未来的启示
近期生成式AI的进步令人兴奋,它必将对未来产生重大而未知的影响。我们未来还需要开发者吗?他们会被AI取代吗?大科技公司会垄断这项技术吗?我们会完全依赖API提供商,牺牲开源精神和数据隐私吗?作者认为,我们可以从另一项突破性技术——互联网中学到很多。
从互联网历史中学习
作者分享了自己从2006-2009年学习CSS和网页开发,到如今投身于NLP(自然语言处理)和AI领域的经历。这展现了技术演进的个人视角。
Python在AI领域的成功,恰恰因为它是一门通用语言。 2023年Python开发者调查显示,Python在数据分析、Web开发、机器学习等多个领域都有广泛应用,其通用性是它在AI领域获胜的关键。
大科技公司是在“重新发明轮子和道路”
回顾互联网历史,某中心(原谷歌)凭借搜索、Chrome/Chromium浏览器(驱动着某中心(原微软)Edge、Opera等)、Gemini模型以及广告业务,构建了庞大的生态。他们也曾推动加速移动页面(AMP)等项目。这引发我们思考:大科技公司会垄断AI吗?
我们关心的问题:
- 我们还需要开发者吗?
- 大科技公司会垄断AI吗?
- 开源软件的未来如何?
- AI开发者会被AI取代吗?
- 我们会依赖API提供商吗?
- 如何保证数据隐私?
核心洞见:不要混淆“抬高地板”和“抬高天花板”
- “地板”:指基础、易用的技术。例如,本地商店无需开发者就能建网站(+10%客户);待办事项App用API增加翻译功能(+5%国际用户增长)。这些是高采纳率的技术,让更多人能完成基本任务。
- “天花板”:指高价值、复杂的应用。例如,流媒体服务让网页播放器快1毫秒(+3%使用时长);酒店预订平台改进推荐系统(+0.5%点击率,+100万美元收入)。这些是高价值的应用,需要开发者进行深度优化。
未来AI的技术栈将包括:网站构建器、框架、浏览器、Web标准、AI功能,而开发者则专注于构建框架、环境和核心技术,以触及更高的天花板。
高价值用例值得投入开发
以某机构(原S&P Global)的案例研究为例:
- 场景:在高安全环境下,从实时大宗商品交易洞察中提取结构化属性。
- 方法:在标注过程中使用大语言模型(LLM),通过人机协同,将数据开发速度提升了10倍。
- 成果:最终部署了8个以上市场管道,模型大小仅6MB,F-Score达到99%,处理速度超过16,000词/秒。
人机协同蒸馏流程
- LLM提示:利用LLM进行初步数据标注。
- Prodigy工具:在“人机协同”流程中进行持续评估。
- 组件迁移学习:将LLM的知识蒸馏到更小的组件中。
- 蒸馏模型:生成更小、更快、更私密的模型。
- 部署:将优化后的模型投入生产。
这个开发过程让开发者重新夺回控制权。
开发工作流的演进
- 静态页面 → 动态页面 → 静态页面(构建时编译静态数据)
- 自定义模型 → 预训练模型 → 蒸馏模型(将模型蒸馏成更小、更快、更私密的组件)
AI产品不止是模型
AI产品的成功不仅取决于技术,更在于产品层面的差异化。
- 机器 facing 模型:如GPT-4。
- 人类 facing 系统:如ChatGPT。
- 关键差异化因素:UI/UX、营销、定制化、速度、准确性、延迟、成本。
- 可互换组件:基于研究成果,可以量化影响并轻松替换组件(如LLM)。
关于数据:用户数据是产品的优势,而非机器 facing 任务的基础。获取通用知识并不需要特定的数据。互操作性才是垄断的对立面。
结论与启示
- 对开发者:不要混淆“抬高地板”与“抬高天花板”。高价值用例值得投入精力去开发。
- 对模型:通过在开发时编译,夺回控制权,构建更小、更快、更私密的模型。
- 对开源:互操作性是垄断的对立面。LLM可以成为产品或流程中可替换的一部分。
- 对监管:监管应聚焦于产品和行为,而非技术组件。FINISHED