智能问数主流技术路径及代表厂商调研报告调研说明为进一步做好智能问数相关能力建设研究，现结合公开资料、行业实践及产品落地

一、调研说明

为进一步做好智能问数相关能力建设研究，现结合公开资料、行业实践及产品落地情况，对当前主流技术路径及代表厂商情况进行调研分析。

从当前市场发展情况看，智能问数相关产品普遍围绕自然语言问答、数据分析、智能辅助等方向展开布局，外部宣传口径较为接近。但从具体建设模式看，不同路径在前期建设投入、后期维护投入、使用效果、准确率以及后续扩展方式等方面存在较大差异。

为便于后续开展交流、试点和比较判断，现对相关情况作统一梳理。

二、评估口径

本次调研主要围绕以下四个方面进行。

（一）前期投入成本

主要考察前期数据准备、指标梳理、宽表建设、语义建模、规则建设、平台改造等方面的投入情况。

（二）后期投入成本

主要考察业务变化、问题增加、场景扩展后，是否需要持续增加人工治理、规则维护、数据加工和系统调整等工作。

（三）使用效果

主要考察业务人员理解和使用难度、固定场景可用性、推广便利性以及日常使用体验。

（四）准确率表现

主要考察固定问题、复杂问题、多表问题以及超出既有边界问题下的回答质量和稳定性。

三、主流技术路径情况

（一）指标平台路径

该路径主要是先对常用指标、统计口径和业务定义进行统一，再由系统围绕既有指标体系开展问数和分析。

从前期投入看，重点在指标治理和口径统一。如果单位已有较成熟的指标体系，相关工作相对容易衔接；如果基础较弱，则需要先补较多治理工作。

从后期投入看，在问题范围相对固定时，维护压力总体可控；但当问题种类、组合方式和分析主题不断增加时，往往需要持续补充指标定义、统计规则和边界条件。此类成本通常不是平缓增加，而是可能随着问题组合扩大而巨幅增加。

从使用效果看，该路径在固定经营分析、常见指标问答等场景中通常较稳。

从准确率看，已纳入指标体系的问题一般表现较好；但对于跨主题、跨关系和开放式问题，受限情况较为明显。

总体上看，该路径适合解决标准化程度较高、问题边界较清晰的场景，但持续扩展时对人工治理依赖较强。

（二）预制宽表路径

该路径主要是围绕高频分析主题，提前对数据进行整理和加工，形成便于查询的宽表，再由用户通过自然语言方式提问。

从前期投入看，重点在主题梳理、宽表设计、字段整理、口径确认和数据加工。主题越多，前期建设工作量越大。

从后期投入看，如果仅覆盖少量固定主题，维护总体可控；但一旦主题增多、问题组合增多，后续补表、调表、扩字段、改口径等工作量往往会迅速增加，并可能形成巨幅增加。

从使用效果看，该路径在试点阶段通常较容易较快形成结果，适合先覆盖一批明确问题。

从准确率看，已覆盖场景一般表现较好；但当问题超出宽表覆盖范围后，回答效果和准确率容易明显下降。

总体上看，该路径适合前期快速形成阶段性成果，但后续扩展压力需要重点关注。

（三）语义层 / 治理增强路径

该路径主要是通过建设统一语义层、规则体系、口径约束和治理机制，在相对明确的边界内开展智能问数和分析。

从前期投入看，除基础接入外，还需要投入较多工作建设语义层和规则体系，因此前期投入一般较高。

从后期投入看，当业务变化、问题扩展、规则联动增加后，治理资产维护压力会持续上升。在场景复杂度不断加大的情况下，后期投入同样可能出现巨幅增加。

从使用效果看，该路径在可控性、稳定性和一致性方面更有优势，适合正式分析和汇报类场景。

从准确率看，在治理边界内的问题通常较稳；但对复杂开放问题的支持仍受规则边界约束。

总体上看，该路径适合重视准确性、稳定性和口径一致性的场景，但长期治理投入不可忽视。

（四）本体语义路径

该路径主要是先围绕业务对象、关系、属性、行为、事件和上下文建立统一理解框架，再在此基础上开展问数、分析和推理。

从前期投入看，重点不在于逐题预制，而在于业务建模、关系梳理和语义框架建设，因此前期门槛一般较高。

从后期投入看，如果前期理解框架建设较为扎实，后续面对新问题、新主题和复杂关系时，有机会减少逐题补充资产的依赖，使扩展成本保持在相对可控水平，而不至于随问题组合扩大而迅速巨幅放大。

从使用效果看，该路径更适合复杂问题和长期能力建设。

从准确率看，在复杂场景下具备一定潜力，但实际效果仍需通过真实业务问题验证。

总体上看，该路径适合业务复杂、希望开展长期建设的场景，但前期建设难度相对较高。

四、代表厂商情况

（一）火山引擎 Data Agent

综合公开资料和落地逻辑判断，该产品更接近“Text-to-SQL + 预制宽表 / 语义预处理”的工程化混合路径。

前期在已有平台基础较好时较易启动，但若需覆盖更多主题，仍需投入较多预制和整理工作。

后期随着问题组合增加，补宽表、补主题和补规则的工作量可能明显上升。

从使用效果和准确率看，在边界较清晰的常见场景中通常较易形成效果，但对预制覆盖程度依赖较强。

（二）京东 JoyDataAgent

综合公开资料判断，该产品更接近“指标平台 / 数据治理增强 + 多智能体框架”的路径。

前期一般需要较强技术团队参与治理、框架搭建和定制化工作。

后期如果持续扩展场景，内部工程维护和治理投入通常较高，复杂度可能随着规则和流程增加而放大。

从使用效果和准确率看，在治理边界清晰、技术支撑较强的场景中表现更稳。

（三）Aloudata Agent

综合公开资料判断，该产品更接近“指标平台 / 明细语义层治理 + 智能问数增强”的路径。

前期较依赖治理基础，特别是语义层、口径体系和规则体系建设。

后期需要持续维护治理资产，随着问题和规则关系增加，后期投入同样可能持续上升，甚至出现明显放大。

从使用效果和准确率看，在固定口径和正式分析场景中通常较稳。

（四）UINO

从路线表达看，该产品更接近“本体语义路径”，即先建立业务对象和关系理解框架，再开展问数、分析和推理。

前期重点在业务理解、对象建模和语义框架建设，投入门槛相对较高。

后期如果前期框架建设到位，有机会降低逐题补资产的依赖，使扩展成本保持在相对可控区间。

从使用效果和准确率看，在复杂问题和长期能力建设方面更值得关注，但实际效果仍需通过试点验证。

五、综合判断

综合比较可以看出，指标平台路径、预制宽表路径和语义层 / 治理增强路径，虽然实现方式不同，但总体上都更接近“先人工建设，再由 AI 做语义匹配、调用和呈现”的模式。

此类路径在固定场景中通常更容易较快出效果，也更容易在边界清晰的问题上保持稳定。

但需要重点注意的是，这类路径的后期投入并不是随着问题增加而简单同步增加，而是在问题组合、业务变化和主题范围持续扩大后，往往会出现巨幅增加。问题越复杂，越容易从单点维护演变为成体系的新增建设和持续治理工作。

相较之下，本体语义路径更强调前期建立统一理解框架，以减少后续逐题补资产的依赖。其前期门槛较高，但长期扩展潜力值得关注。

六、下一步建议

下一步如需继续推进相关工作，建议重点把握以下几个方面。

一是试点验证不能只看演示效果，应重点关注真实业务问题下的实际表现。

二是比较判断要重点围绕前期投入成本、后期投入成本、使用效果和准确率四个方面展开，特别要关注问题组合扩大后后期投入是否会巨幅放大。

三是如以短期形成成果为目标，可优先关注预制型和治理型路径；如以长期能力建设为目标，则应重点关注底层业务理解路径。

四是最终判断应坚持以试点结果为依据，不宜仅根据概念表达或单次展示作出结论。