《将来进行时》第 1 期当AI开始替人做决定、写论文、选孩子，甚至被人用来策划犯罪——"我该信什么"这个老问题，正在变成

摘要

这周我读到几条看似不相干的新闻：OpenAI因为用户用ChatGPT策划犯罪被美国司法部调查；Nature撤了一篇关于AI对教育有好处的研究——因为"方法部分可能也是AI写的"；Nature揭开了学术引用体系中大规模造假的盖子，至少20万篇论文的引用数据有问题。还有AI进入了试管婴儿手术室，帮医生选哪个胚胎先植入。

一条线把这些事串了起来：当AI开始替人做决定、写论文、选孩子，甚至被人用来策划犯罪——"我该信什么"这个老问题，正在变成"AI值不值得我信"。

开场

上个月，一个佛罗里达人做了件事：他在策划谋杀的时候，打开ChatGPT问了一句"怎么才能不留痕迹"。ChatGPT认真地解释了——然后他就照做了。

现在美国司法部在查的，不是这个人，而是OpenAI。

这不是科幻片。这是2026年5月7日Nature新闻的标题：OpenAI is under criminal investigation。

你可能觉得这事离你很远。但你想想：如果你手机里的AI助手"教"别人犯了罪，是那个人的错，还是做出这个AI的公司的错？

答案还没有。但这件事会决定你未来能用AI做什么、不能用AI做什么。

这周最值得看的未来信号

1. OpenAI遭刑事调查：AI公司的责任边界在哪里？

发生了什么：美国司法部对OpenAI展开刑事调查，起因是一名佛罗里达嫌疑人用ChatGPT策划谋杀。这是全球首个针对AI公司的重大刑事调查。

和普通人有什么关系：如果OpenAI被判有罪，意味着AI公司必须为用户的行为负责。这可能会让所有AI产品加上更严的审查——下次你跟AI聊个敏感话题，它可能直接"装死"。

还不能下什么结论：OpenAI可以援引Section 230抗辩（类似平台不对用户内容负责），但"教唆犯罪"超出了传统内容责任的范畴。这个判例会是什么样，没有人知道。

🔗 [Nature News — OpenAI criminal investigation](www.nature.com/articles/d4…)

2. Nature揭了学术引用界的底：20万篇论文的引用是靠"刷"的

发生了什么：Nature分析了250万篇论文（含2.5亿条引用），发现至少20万篇存在系统性引用操控。部分期刊的引用数据中，高达20%来自"引用农场"——一种人为操作的引用网络。

和普通人有什么关系：医生开药、政府定政策，都参考学术论文。如果有人能"刷"论文引用，你吃的药、你遵守的防疫规定——背后依据的论文，可能没那么"权威"。

还不能下什么结论：无法区分"无知误引"和"恶意操控"。但自然编辑说了一句话："学术评价体系对引用量的过度依赖，本身就是问题的根源。"

🔗 [Nature — Surge in fake citations](www.nature.com/articles/d4…)

3. AI胚胎评分系统：算法正在替人类做最私密的决定

发生了什么：MIT Technology Review专题报道，AI胚胎评分系统已在多国临床使用——医生拿出一排胚胎照片，AI先评分：这个92分、那个67分。人类胚胎学家拿到了一份"AI版成绩单"。

和普通人有什么关系：如果你或身边的人做试管婴儿（IVF），AI很可能参与选择哪个胚胎被植入。你甚至不知道评分标准是什么。

还不能下什么结论：AI评分是否真能提高活产率？目前没有大样本临床试验结果。评分标准是否暗含种族或阶层偏见？没有人能保证不会。

🔗 [MIT Tech Review — How technology transformed babymaking](www.technologyreview.com/2026/05/08/…)

4. 阳台太阳能在美国爆火：挂阳台、插插座就发电

发生了什么：美国数十个州立法允许居民安装即插即用型阳台光伏系统，价格500-2000美元。德国10%的家庭已经用上了。

和普通人有什么关系：不用屋顶、不用施工队，挂块板插上插座就发电。在中国的租房者也在问：我们什么时候能用上？

🔗 [MIT Tech Review — Balcony solar boom](www.technologyreview.com/2026/05/07/…)

5. NASA推进器测试成功：去火星的"发动机"过了大考

发生了什么：NASA JPL成功测试120kW锂燃料等离子推进器，功率是当前航天器电推系统的25倍。

和普通人有什么关系：去火星这件事，从"可能"变成了"什么时候"。新型推进用锂+电产生等离子体，比传统燃料省90%。

🔗 [ScienceDaily — NASA thruster](www.sciencedaily.com/releases/20…)

6. Colo癌免疫治疗突破：9周治疗近3年不复发

发生了什么：英国UCL的临床试验中，结直肠癌患者接受9周术前免疫治疗，59%的患者肿瘤完全消失。随访33个月，零复发。

🔗 [ScienceDaily — Colon cancer breakthrough](www.sciencedaily.com/releases/20…)

主线故事：为什么这几件事其实是一件事

这周有一个越来越清晰的画面：我们正在亲手制造一个自己不一定信任的世界。

你看这三件事——

第一件，AI学会了"回答问题"但被人用来犯罪，于是我们问：AI有没有责任？

第二件，学术论文建立了"引用越多越权威"的评价体系，但这个体系被刷了，于是我们问：论文还靠得住吗？

第三件，AI开始进入人类最私密的决策——选哪个胚胎有机会出生，于是我们问：AI真的比人更会选吗？

三个问题的本质是一样的：当一项技术从"工具"变成了"决策者"，谁来担保它的可靠？

学术界的信任危机和AI行业的信任危机，其实是同一种病：我们把权力交给了系统，却没有建立监督系统的机制。引用量是人刷的，责任在人不在系统；AI的回答是算出来的，责任在设计者和使用者之间——都不是"系统自己会变好"就能解决的事。

有意思的是，这周也出现了"信任锚点"的希望：硅基量子比特用造手机芯片的工艺实现了99%保真度的逻辑门——如果量子计算用成熟的半导体工艺来造，那它比实验室里的稀奇古怪设备更值得信赖。固态电池的中国公司宣布2026年启动量产线——当一项技术从"论文谈"变成"工厂造"，信任就自然生长出来了。

所以问题可能不是"新技术值不值得信"，而是：给技术"加码"的方式，是建立更可靠的机制，还是回到更传统的信任锚——工业化、可检验、可复现？

未来已来：它已经走到哪一步

学术信任：不只是道德问题，是数学问题

Nature花了多长时间找出那20万篇问题论文？不是随机抽查——是分析了2.5亿条引用数据。也就是说，能"刷引用"的人越来越多，能"查引用"的工具也越来越强。

这有一个好消息和一个坏消息。

好消息是：AI检测引用造假的技术也在进化。Nature的编辑已经在讨论用AI+区块链重建信任。

坏消息是：造AI检测工具的人，和造AI写论文工具的人，是同一个群体。你能造疫苗，也能造病毒。这件事本质上是"信任技术竞赛"——但人类历史上，这种竞赛一般会持续很长时间才会找到平衡。

AI做决定：从"辅助工具"到"决策者"

OpenAI刑事调查和AI胚胎评分这两件事放在一起看，有一条明显的时间线：

第一阶段（2022-2024）：AI是工具。你问它答，错了你负责。

第二阶段（2025-2026）：AI是助理。它提建议，人类做选择——比如胚胎评分。

第三阶段（2026+）：AI是"决策参与者"但责任归属模糊——就像OpenAI的案例。

这条时间线的终点是什么？可能是一系列判例，也可能是专门的AI责任法。德国、日本和中国都在起草类似文件。可能再过两年，每个AI产品的"帮助菜单"里，会多一行字：本AI导致的法律责任由____承担。

未来将来：如果它继续往前走

版本一（最值得期待的）

学术评价体系主动变革——从"数引用量"转向"质量+复现性"；AI做判例辅助但不取代人类的最后判断；阳台太阳能成为每个城市家庭的标配，电力从"集中式"走向"分布式"；量子计算让新药发现从10年缩短到6个月。

版本二（最需要防范的）

引用农场和AI写论文的恶性循环让学术信任崩塌，公众不再相信任何研究（包括气候变化科学、疫苗安全等）→"事实"被彻底政治化；AI胚胎评分暗含偏见但缺乏监管→优生学以"技术优化"的面貌回潮；AI公司因过度风控变得"什么都不让问"→AI退化成有心理防御的内容过滤网。

你更担心哪个版本？

一个有意思的小信号

这周有一位叫Chantle Edillor的科学家进入了我的视野——她本来研究人类疾病，疫情期间迷上了烤酸面包，研究酵母的过程中发现酵母可以用来做药物递送。于是她彻底换了职业方向。她的故事被Nature写了。

Nature的标题是："How a passion for baking fermented a fresh career move。"

你那个被说"不务正业"的爱好，也许不只是爱好。

🔗 [Nature — From baking to career move](www.nature.com/articles/d4…)

现有讨论：大家真正争的是什么

Reddit上的讨论

（引述自Hacker News风格讨论）："如果OpenAI被判有责，那所有聊天机器人都会变成只会说'对不起我不能回答这个问题'的废物。"

学术圈的争论

（Nature回帖 & 社论区）："引用操控不是道德问题，是制度问题。"——如果大学评职称的唯一标准不是论文数量，引用农场就不会那么大行其道。

MIT Tech Review讨论区

："AI胚胎评分最可怕的地方不是它不准确，而是它太准确了——但你不知道它用哪把尺子量的。"

Arc-AGI讨论社区

（引述自5/4的信号）：有开发者认为，AI在ARC挑战上的进展说明"AI学会抽象推理了"，但Critics说这是"高级模式匹配，远不是推理"。

反方证据：先别急着激动

1. "AI破坏学术信任"这件事可能被夸大了Nature的分析发现"只有"8%的论文存在引用异常，不是80%。问题虽然存在，但尚未达到系统性崩盘的程度。而且——大多数学术论文仍然可靠。

2. OpenAI刑事调查≠OpenAI被判有罪调查和定罪之间差了一个完整的司法过程。Section 230是最强护盾。即使没有Section 230，AI的责任链条（开发者→提供者→使用者→犯罪者）在法律上如何分解，从未被清晰界定。

3. AI胚胎评分目前只是一个"参考数据"目前没有一家生殖中心让AI单独做决定。最终的植入决策仍然由医生和患者共同做出。AI评分是给人类多了一个参考信息，不是抢走了人类的决定权。

国内讨论

如果这些趋势到了中国——

学术信任：中国的"唯论文"评价文化比国外更严重。如果Nature暴露的虚假引用问题在中文学术界也存在（很可能是的），但中文媒体的跟进和讨论还远不够。

AI监管：中国的《生成式AI管理办法》强调"服务提供者需承担内容安全主体责任"——但"教唆犯罪"这种极端情况是否在责任范围内，法律尚未解释。OpenAI的刑事调查可能成为中国版本的参考。

阳台太阳能：这是最直接的"中国机会"。数亿城市租房人口无法使用屋顶光伏但拥有阳台。德国出台了阳台光伏的简化并网政策，中国目前仍受物业管理条例、电网标准和邻里纠纷的制约。政策一松，市场就开。

AI辅助生育：中国的辅助生殖市场规模超千亿，但目前没有明确监管AI胚胎评分的框架。这意味着中国可能成为——好或坏——AI生育技术的"最大试验场"。

结尾

这周最让我睡不着觉的，不是AI会取代人工（这事讨论太多了）。最让我睡不着觉的是：我们建立信任的方式本身需要被信任。

引用数据可以刷——那信引用吗？ AI的评分标准不透明——那信AI的推荐吗？ OpenAI的CEO说他们负责——但当犯罪都跟AI有关时，一问"谁担责"就变成了踢皮球。

所以今天想问你的问题是：你相信的"权威"——论文、专家、AI助手——你有没有想过，这些东西的"靠谱"，是自然而然的，还是被建构成的？

有想法的话，留言聊聊。

本周参考资料：Nature News (DOI: 10.1038/d41586-026-01405-y); Nature (DOI: 10.1038/s41586-026-10423-9); Nature (DOI: 10.1038/s41586-026-00748-w); MIT Technology Review (May 7-8, 2026); ScienceDaily (May 6, 2026); MIT Tech Review — Balcony Solar Boom; Anthropic Enterprise AI Agents Report (2026)