企业AI数据挑战与解决方案

40 阅读3分钟

企业仍面临AI数据挑战

几年前,商业技术领域最流行的术语是"大数据"——指组织收集大量信息以探索新的运营方式和战略方向。如今越来越明显的是,企业在利用大数据时面临的问题依然存在,而新技术AI正让这些问题再次浮出水面。如果不解决困扰大数据的问题,AI实施将继续失败。

那么阻碍AI实现承诺的问题是什么?

绝大多数问题源于数据资源本身。为了理解这个问题,考虑一个普通工作日内使用的以下信息来源:

在中小型企业中:

  • 存储在用户笔记本电脑、Google Sheets、Office 365云端的电子表格
  • 客户关系管理(CRM)平台
  • 同事、客户、供应商之间的电子邮件往来
  • Word文档、PDF文件、网络表单
  • 即时通讯应用

在大型企业中:

  • 以上所有,再加上
  • 企业资源规划(ERP)系统
  • 实时数据流
  • 数据湖
  • 多个点产品背后的不同数据库

值得注意的是,这个简单列表并不全面,也不打算如此。它表明仅五行内容中就列出了大约十几个可以找到信息的地方。大数据需要(可能仍然需要)而AI项目也依赖的是,以某种方式将所有元素整合在一起,使计算机算法能够理解。

某机构的2024年人工智能炒作周期将AI就绪数据置于炒作周期的上升曲线,估计需要2-5年才能达到"生产力稳定期"。考虑到AI系统挖掘和提取数据,大多数组织——除了最大型的——都没有构建的基础,可能在未来1-4年内无法获得AI协助。

AI实施的根本问题与过去大数据创新在炒作周期中面临的困境相同——从创新触发、期望膨胀期、幻觉破灭谷底、启蒙斜率到生产力稳定期——数据以多种形式出现;可能不一致;可能遵循不同标准;可能不准确或有偏见;可能是高度敏感的信息,或是陈旧因此无关紧要。

将数据转换为AI就绪状态的过程在今天仍然相关(可能更加相关)。希望抢先机的公司可以试验当前可用的许多数据处理平台,并且按照越来越普遍的建议,可以从离散项目开始作为测试平台,评估新兴技术的有效性。

最新数据准备和组装系统的优势在于,它们旨在以AI价值创造平台使用数据的方式准备组织的信息资源。例如,它们可以提供精心编码的防护栏,帮助确保数据合规性,并保护用户免于访问有偏见或商业敏感的信息。

但生成连贯、安全且格式良好的数据资源的挑战仍然是一个持续存在的问题。随着组织在日常运营中获得更多数据,编制最新的数据资源是一个持续的过程。大数据可以被视为静态资产,而用于AI摄取的数据必须尽可能接近实时地准备和处理。

因此,情况仍然是机会、风险和成本之间的三方平衡。供应商或平台的选择对现代企业来说从未如此关键。