一、调研说明
为进一步做好智能问数相关能力建设研究,现结合公开资料、行业实践及产品落地情况,对当前主流技术路径及代表厂商情况进行调研分析。
从当前市场发展情况看,智能问数相关产品普遍围绕自然语言问答、数据分析、智能辅助等方向展开布局,外部宣传口径较为接近。但从具体建设模式看,不同路径在前期建设投入、后期维护投入、使用效果、准确率以及后续扩展方式等方面存在较大差异。
为便于后续开展交流、试点和比较判断,现对相关情况作统一梳理。
二、评估口径
本次调研主要围绕以下四个方面进行。
(一)前期投入成本
主要考察前期数据准备、指标梳理、宽表建设、语义建模、规则建设、平台改造等方面的投入情况。
(二)后期投入成本
主要考察业务变化、问题增加、场景扩展后,是否需要持续增加人工治理、规则维护、数据加工和系统调整等工作。
(三)使用效果
主要考察业务人员理解和使用难度、固定场景可用性、推广便利性以及日常使用体验。
(四)准确率表现
主要考察固定问题、复杂问题、多表问题以及超出既有边界问题下的回答质量和稳定性。
三、主流技术路径情况
(一)指标平台路径
该路径主要是先对常用指标、统计口径和业务定义进行统一,再由系统围绕既有指标体系开展问数和分析。
从前期投入看,重点在指标治理和口径统一。如果单位已有较成熟的指标体系,相关工作相对容易衔接;如果基础较弱,则需要先补较多治理工作。
从后期投入看,在问题范围相对固定时,维护压力总体可控;但当问题种类、组合方式和分析主题不断增加时,往往需要持续补充指标定义、统计规则和边界条件。此类成本通常不是平缓增加,而是可能随着问题组合扩大而巨幅增加。
从使用效果看,该路径在固定经营分析、常见指标问答等场景中通常较稳。
从准确率看,已纳入指标体系的问题一般表现较好;但对于跨主题、跨关系和开放式问题,受限情况较为明显。
总体上看,该路径适合解决标准化程度较高、问题边界较清晰的场景,但持续扩展时对人工治理依赖较强。
(二)预制宽表路径
该路径主要是围绕高频分析主题,提前对数据进行整理和加工,形成便于查询的宽表,再由用户通过自然语言方式提问。
从前期投入看,重点在主题梳理、宽表设计、字段整理、口径确认和数据加工。主题越多,前期建设工作量越大。
从后期投入看,如果仅覆盖少量固定主题,维护总体可控;但一旦主题增多、问题组合增多,后续补表、调表、扩字段、改口径等工作量往往会迅速增加,并可能形成巨幅增加。
从使用效果看,该路径在试点阶段通常较容易较快形成结果,适合先覆盖一批明确问题。
从准确率看,已覆盖场景一般表现较好;但当问题超出宽表覆盖范围后,回答效果和准确率容易明显下降。
总体上看,该路径适合前期快速形成阶段性成果,但后续扩展压力需要重点关注。
(三)语义层 / 治理增强路径
该路径主要是通过建设统一语义层、规则体系、口径约束和治理机制,在相对明确的边界内开展智能问数和分析。
从前期投入看,除基础接入外,还需要投入较多工作建设语义层和规则体系,因此前期投入一般较高。
从后期投入看,当业务变化、问题扩展、规则联动增加后,治理资产维护压力会持续上升。在场景复杂度不断加大的情况下,后期投入同样可能出现巨幅增加。
从使用效果看,该路径在可控性、稳定性和一致性方面更有优势,适合正式分析和汇报类场景。
从准确率看,在治理边界内的问题通常较稳;但对复杂开放问题的支持仍受规则边界约束。
总体上看,该路径适合重视准确性、稳定性和口径一致性的场景,但长期治理投入不可忽视。
(四)本体语义路径
该路径主要是先围绕业务对象、关系、属性、行为、事件和上下文建立统一理解框架,再在此基础上开展问数、分析和推理。
从前期投入看,重点不在于逐题预制,而在于业务建模、关系梳理和语义框架建设,因此前期门槛一般较高。
从后期投入看,如果前期理解框架建设较为扎实,后续面对新问题、新主题和复杂关系时,有机会减少逐题补充资产的依赖,使扩展成本保持在相对可控水平,而不至于随问题组合扩大而迅速巨幅放大。
从使用效果看,该路径更适合复杂问题和长期能力建设。
从准确率看,在复杂场景下具备一定潜力,但实际效果仍需通过真实业务问题验证。
总体上看,该路径适合业务复杂、希望开展长期建设的场景,但前期建设难度相对较高。
四、代表厂商情况
(一)火山引擎 Data Agent
综合公开资料和落地逻辑判断,该产品更接近“Text-to-SQL + 预制宽表 / 语义预处理”的工程化混合路径。
前期在已有平台基础较好时较易启动,但若需覆盖更多主题,仍需投入较多预制和整理工作。
后期随着问题组合增加,补宽表、补主题和补规则的工作量可能明显上升。
从使用效果和准确率看,在边界较清晰的常见场景中通常较易形成效果,但对预制覆盖程度依赖较强。
(二)京东 JoyDataAgent
综合公开资料判断,该产品更接近“指标平台 / 数据治理增强 + 多智能体框架”的路径。
前期一般需要较强技术团队参与治理、框架搭建和定制化工作。
后期如果持续扩展场景,内部工程维护和治理投入通常较高,复杂度可能随着规则和流程增加而放大。
从使用效果和准确率看,在治理边界清晰、技术支撑较强的场景中表现更稳。
(三)Aloudata Agent
综合公开资料判断,该产品更接近“指标平台 / 明细语义层治理 + 智能问数增强”的路径。
前期较依赖治理基础,特别是语义层、口径体系和规则体系建设。
后期需要持续维护治理资产,随着问题和规则关系增加,后期投入同样可能持续上升,甚至出现明显放大。
从使用效果和准确率看,在固定口径和正式分析场景中通常较稳。
(四)UINO
从路线表达看,该产品更接近“本体语义路径”,即先建立业务对象和关系理解框架,再开展问数、分析和推理。
前期重点在业务理解、对象建模和语义框架建设,投入门槛相对较高。
后期如果前期框架建设到位,有机会降低逐题补资产的依赖,使扩展成本保持在相对可控区间。
从使用效果和准确率看,在复杂问题和长期能力建设方面更值得关注,但实际效果仍需通过试点验证。
五、综合判断
综合比较可以看出,指标平台路径、预制宽表路径和语义层 / 治理增强路径,虽然实现方式不同,但总体上都更接近“先人工建设,再由 AI 做语义匹配、调用和呈现”的模式。
此类路径在固定场景中通常更容易较快出效果,也更容易在边界清晰的问题上保持稳定。
但需要重点注意的是,这类路径的后期投入并不是随着问题增加而简单同步增加,而是在问题组合、业务变化和主题范围持续扩大后,往往会出现巨幅增加。问题越复杂,越容易从单点维护演变为成体系的新增建设和持续治理工作。
相较之下,本体语义路径更强调前期建立统一理解框架,以减少后续逐题补资产的依赖。其前期门槛较高,但长期扩展潜力值得关注。
六、下一步建议
下一步如需继续推进相关工作,建议重点把握以下几个方面。
一是试点验证不能只看演示效果,应重点关注真实业务问题下的实际表现。
二是比较判断要重点围绕前期投入成本、后期投入成本、使用效果和准确率四个方面展开,特别要关注问题组合扩大后后期投入是否会巨幅放大。
三是如以短期形成成果为目标,可优先关注预制型和治理型路径;如以长期能力建设为目标,则应重点关注底层业务理解路径。
四是最终判断应坚持以试点结果为依据,不宜仅根据概念表达或单次展示作出结论。