你的“数字同事”来了:DataWorks Data Agent 全面升级

0 阅读5分钟

在人工智能重塑生产力的今天,数据研发正在经历一场静默而深刻的变革——  我们不再满足于“AI 写代码”,而是期待它能真正听懂业务、理解流程、自主执行任务。 

近日,阿里云 DataWorks Data Agent 全面升级。作为面向 AI 时代的全新智能体形态,它将大模型的认知能力与企业数据资产深度融合,支持自然语言交互、任务自主规划与端到端闭环执行,推动数据开发从“人驱动系统”迈向“系统主动服务”的新阶段。

一、什么是 DataWorks Data Agent?

阿里云 DataWorks Data Agent 是一款面向数据开发与治理场景的智能体数字员工。作为深度集成于 DataWorks 平台的一站式 AI 智能体,它突破了传统 Copilot “辅助建议”的局限,正式升级为可独立规划并执行复杂任务的数字化劳动力。

产品内置 Agent 智能体、代码编程助手、ChatBI 及快捷 AI 操作等核心能力,全面覆盖数据集成、开发、运维、治理与分析全链路。依托强大的 AI 推理与自然语言交互技术,用户仅需通过对话即可自动化完成数据集成、数据开发与运维、质量治理、数据分析等全周期任务,为企业带来高效、可信的智能化数据开发新体验。

DataWorks Data Agent 提供统一交互入口,支持 Chat 对话式 与 CLI 命令行双模体验。Chat 模式以自然语言降低使用门槛,实现“所说即所得”;CLI 模式专注工程化集成,无缝对接脚本调度与 CI/CD 流水线,全面适配业务探索与技术集成的多元诉求。

image - 2026-05-20T153242.052.png DataWorks Data Agent Chat 模式   

image - 2026-05-20T153248.365.png DataWorks Data Agent CLI 模式

二、全链路智能:覆盖数据集成、开发、治理、运维、分析五大场景

DataWorks Data Agent 的能力已全面覆盖数据研发生命周期,真正实现“一句话贯穿全链路”。

能力场景传统方式(Before)Agent 模式(After)提升
数据集成
(数据同步)
需深入理解数据源连接、字段映射逻辑、分区策略及调度依赖等专业概念。一句话指令:
“把MySQL每天新增数据同步到Hologres库”
Agent 自动解析业务语义并生成标准配置。
⏱️ 全过程 <2 分钟
不需要了解同步专业背景知识,只需关心业务,配置准确率提升
数据开发
(ETL 开发)
需求分析靠人工理解,数据探查靠手动查找,开发实施靠手动编写,测试验证及发布也是手动的。整个过程需要 12-23 小时。导致数据研发工作效率低下、规范执行困难、质量保障不足、知识复用困难。输入:
“请按照需求文档中的内容,构建“直播间商品成交数据”的ads层。”
Agent 自动生成进行需求分析、创建节点、生成代码、配置依赖、发起发布
⏱️ 端到端交付缩短至分钟级
研发效率从“天级”提升到“分钟级”,需求评估到开发实施、测试验证、上线发布,每个环节都有 AI 自动完成,只有最终发布环节需要人工确认。真正实现了端到端智能化开发。
数据治理
(质量管控)
人工搜索对应表 → 查看表详情 → 查看字段样本内容 → 查看加工SQL → 配置规则 → 测试运行  → 查看测试结果 → 保存质量监控
被动响应,整改周期长达数日
下达指令:
针对用户表,自动配置表行数相关质量规则。
Agent 智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则,
全程留痕,支持审计
主动治理,闭环执行
规范执行率提升
数据地图
(元数据查找)
查数据、查依赖翻血缘图、问同事、看文档
确认变更靠日志或沟通,平均查找 >30 分钟
提问:
“哪个表有用户的收货地址?”
“谁改过这张宽表?”
Agent 秒级返回结果 + 血缘 + 变更记录
查找效率提升 
类似“与数据对话”
数据运维
(管理诊断)
任务失败后人工介入:
查日志、看依赖、比趋势……
平均定位耗时 1~2 小时
任务实例失败后:
数据运维Agent会自动拉取任务日志、实例详情、操作日志、任务代码、最近运行情况等信息,生成诊断报告 +修复方案,用户授权后,数据运维Agent可直接执行运维操作进行任务修复
⏱️ 诊断过程 <5 分钟
异常定位和修复效率直线提升,耗时从小时级降至分钟级
数据分析
(ChatBI)
业务提需求 → 分析师理解 → 探查 → 写查询 → 制图 → 沟通 → 输出
周期 1~3 天,难以实时决策
直接提问:
“上个月各区域销售额同比如何?”
“哪个类目流失用户最多?”
→ 自动识别口径,生成查询与图表
⏱️ 从提问到洞察 <1 分钟
分析效率提升
零代码自助分析
支持多轮对话式探索

三、智能 ≠ 放任:安全与可控是 Agent 的第一准则

DataWorks Data Agent 最重要的话题——安全。安全与可控不是附加特性,而是 Data Agent 作为数字员工被企业信任的第一准则。

两大核心安全特性:

  • 身份透传——Agent 继承了当前用户在租户、空间、数据级的全部权限边界,权限变更实时同步;

  • 原生安全——DataWokrs的安全能力原生集成至 Agent 每一个操作中。

四大安全设计原则:

  • 第一,关键操作人工确认——高风险操作需经用户人工确认;

  • 第二,权限与 GUI 一致—— Agent 权限小于等于用户权限,不存在特权升级通道;

  • 第三,全程可审计——操作留痕、决策可追溯,关键行为全链路记录;

  • 第四,企业级合规——数据可信、操作可控,满足企业安全合规要求。

一句话总结:智能 ≠ 放任,做好安全,是 DataWorks Data Agent 被企业信赖的根基。

四、即刻体验,开启你的智能开发之旅

立即开通 DataWorks Data Agent: dataworks.data.aliyun.com/product/age…

查看官方文档:help.aliyun.com/zh/datawork…