开源模型破局AI黑箱:企业如何掌控技术主权

4 阅读6分钟

主权AI系统:告别“黑箱”解决方案

最迟自中国某机构开源其AI模型代码以来,情况已然明朗:黑箱时代已经结束。追求技术独立,应选择开源。

技术研发部门与开发者如何为企业量身打造语言模型?某机构创始人及SpaCy软件开发者伊内斯·蒙塔尼揭示了其中的核心考量。

事实表明:开源AI模型不仅为企业提供免许可费的使用和架构、数据流的完全透明,更实现了对基础设施、扩展性和模型调优的全面掌控。对本土IT决策者而言,这意味着:不再受制于专有API,规避某国平台供应商不可预测的价格变动,也无需被迫接受云绑定架构。相反,模型可本地化运行,通过微调或LoRA等方式进行针对性优化,并无缝集成到现有系统环境中。借助Hugging Face、LangChain或vLLM等现代框架,入门门槛已大幅降低——即便是中型企业的IT团队,也能借此开发出智能支持特定业务流程的AI应用。

通过开源构建AI能力

若认为为此必须招募顶尖AI专家,则误入歧途。开源AI模型相比不透明的某国“黑箱”方案的一大核心优势在于,其落地实施并不一定需要高度专业的知识——至少在将AI用于传统编码之外的场景时如此。无需额外资质,软件开发者便能利用大语言模型解释复杂关联,或支持如搭建技术架构等非本专业任务。得益于现代开源程序,他们未来将能自行创建AI应用,并承担开发工作的主要部分。在此过程中,他们也能自然而然地“在岗”积累自身的AI知识。

在此背景下,耗时的专业培训或课程已非必需。具体而言:开发者可请求大模型提供解决技术问题的分步指南,或让其详尽解释现有代码库。借助这种“按需知识模块”,后端开发者能轻松承担前端同事的任务。或者,他们也可以向某机构的大模型Gemini询问相应实施步骤,并对答案的可追溯性和合理性进行核查。

这表明:内部开发者或IT通才能够应用和掌控基于AI的工作流,前提是他们了解大语言模型在何处能创造附加价值,以及何时运用开源工具更为简便快捷。以这种方式应对业务需求,能自动获得问题的整体视角,并可能在未来更好地判断是否及何时应运用人工智能。基于开源AI的应用还具有更强的协作性,这有望加速整个实施过程。尤其在引入大语言模型时,机器学习、后端和前端团队各自为政的“孤岛思维”无疑是创新的真正杀手。因为有一点早已明确:部门利己主义会阻碍进步,而开放、基于模型的协作则能激发进步。

并非所有解决方案都需要AI

但并非每个承诺提升生产力的解决方案都必须基于人工智能。在许多情况下,基于规则的逻辑足以精简流程、提升效率。有趣的是,在此过程中AI恰恰能提供支持——例如,借助大语言模型开发正则表达式或匹配模式,以便从非结构化文本中提取结构化信息。换言之:AI模型在评估特定业务解决方案中是否需要人工智能,或传统的基于规则的方法是否已足够时,能提供宝贵帮助。因此,IT专家应始终首先自问:我们是否真的需要为此任务动用大型语言模型?

鉴于大语言模型的无处不在,决定不采用它们并非易事。然而,企业必须始终清醒认识到这些单体系统的弊端。其使用通常需要将敏感数据发送至外部API,从而引发数据保护和数据主权问题。此外,还存在透明度不足的问题:模型得出结论所依据的数据基础往往不明。按模块化、独立解决方案的思路精准调用特定功能几乎不可能。这极大阻碍了与现有IT架构的集成。

结构化数据是决策的关键

一个例子可说明如何通过精准提示构建可靠的决策基础:指示语言模型开发基于规则的逻辑——例如以代码形式或借助开源库——它便能精准提取文本中的信息。如此可开发出可触及、可追溯的解决方案。这种方法有助于评估是传统方法已足够,还是确有必要部署全面的AI架构。

无论如何,对于相关用例而言,从文本中提取结构化数据以获取相应标注的示例并供AI模型学习,是成功的关键。最有价值的信息,是那些尽可能具有企业和专业针对性的数据。因此,建议在此过程中纳入分析师或工程师等其他领域的专家。但这无法一蹴而就。要以这种方式训练AI模型,开发者连同领域专家不仅需要足够数量的用例,还需要投入时间。

为何自行标注?大语言模型承担预备工作

鉴于几乎无人再有时间为AI模型耗时数小时地标注数据,大型语言模型正可在此发挥宝贵作用——通过自动化数据创建流程。在此场景下,开发者只需进行零星的修正。在Prodigy等标注工具中,开发者和领域专家可以快速审查并修正这些示例。最终,他们将获得一个充满应用特定示例的数据集,为训练AI模型提供了恰当的基础。整个过程将反复进行,直至定制模型的性能超越大型语言模型。

结论

大型生成式语言模型在开发过程中扮演着宝贵的辅助角色——例如在数据结构化或生成基于规则的逻辑方面。最终的AI系统则自主运行,无需依赖外部黑箱模型。如此一来,企业不仅能掌控自身敏感数据,也能把控基础设施、成本和结果质量。精准运用开源组件和内部专业知识,能创造透明度、提升效率并增加长期效益——特别是与纯API依赖的云解决方案相比。后者往往带来不透明性、成本波动和外部依赖,而内部系统则可精准优化、符合数据隐私要求地运行,并实现经济高效地扩展。FINISHED