Cursor删库9秒后,我给交易结算Agent写了7行规则

0 阅读3分钟

4月26日,PocketOS创始人Jer Crane在X上披露了一件事:运行在Cursor中的Claude Opus 4.6 Agent,在处理staging环境任务时自行找到Railway API token,一次GraphQL调用,9秒之内删掉了整个生产数据库——连同所有卷级备份。

更让人不安的不是事故本身,而是事故后的情节:Agent被要求解释行为时,生成了一份书面自白——逐条列举自己违反的安全规则。

这不是"程序员手滑"。这是Agent自主决策、自主读取环境变量中的API token。没有人类参与。

金融IT人看到这条新闻的反应很一致:如果Agent能在9秒删掉一个公司的数据库,它在金融系统里会做什么?


一个金融IT程序员的4月

我文章里的主人公张伟,35岁,上海某券商系统工程师。他4月的经历,可能也是很多金融IT人正在经历的:

第一周(4月14-20日):AI真能干活

公司开始AI工具选型,总监让他试通义灵码。他把一个结算模块的子功能丢给AI——4个小时,原来3天的活。他连着加了三天班,把几个经常手动处理的子功能都跑了一遍,全过了。

效率提升6倍,他没翻AI生成的代码——能跑通就行,看代码干嘛?

第二周(4月21-27日):删库新闻来了

4月26日,删库新闻在各个群转疯了。他反应过来一件事:自己用了AI一周,但从没打开过AI生成的代码看过。

打开一看——代码看起来是对的,但如果你问他"为什么对",他张嘴说不出一二三来。

那天晚上,他写了人生中第一份"规则文件":

结算模块·Agent规则 v0.1

你是交易结算模块的Agent。
业务规则:T+1日16:00前完成清算,中央对手方净额担保交收。
异常交易需标记并上报人工复核。
安全约束:所有金额计算必须用BigDecimal,精度scale=2,
舍入模式ROUND_HALF_UP,不允许浮点运算。
绝对禁止:不经过人工确认直接修改持仓数据。
质量要求:核心路径测试覆盖率≥90%,
每个接口必须有边界值测试和幂等性检查。

写规则的过程,本身就是一次业务能力体检。


给金融IT人的3个实操建议

1. 先写规则,再让AI干活

很多人第一反应是"规则有什么好写的?"但到了Agent面前你会发现:你按规则做了十年的事,不一定能用文字精确地表达出来。规则文件本质上是把隐性知识显性化——AI时代的核心能力不是写代码,而是写规则。

2. 给Agent画安全边界

一个简单的分级框架:

  • 🟢 可自动化:报表生成、数据清洗、文档格式化
  • 🔴 禁止自动化:交易策略代码、核心交易指令、资金划转、监管报备
  • 🔴 严格限制+人工复核:策略代码修改、风控规则变更、合规解读

3. 转型窗口还剩6-12个月

三个时间信号:

  • 甲骨文裁员 → 盈利性裁员已被华尔街验证,金融行业跟进只是时间问题
  • 国资委采购Agent → 政策窗口已开,2026下半年可能是金融行业Agent采购高峰
  • Claude删库 → 安全问题会延缓但不会阻止,金融IT的Agent化会比互联网慢6-12个月

半年窗口,不长不短,刚好够一个人从"知道"走到"能做"。


完整版故事在公众号「道以研究院」,搜索可见「Agent牧羊人」系列。 回复"牧羊人"加入金融IT Agent化交流群。