2026年03月20日 AI 科技日报 (Claude推出交互式图表功能,免费用户也能用!)

5 阅读6分钟

2026年03月20日 AI 科技日报 (Claude推出交互式图表功能,免费用户也能用!)

共收录 12 条资讯

AI模型

Pony Alpha 2即将发布

Pony Alpha 2要来了!有人提前在Zai的研究预览版中体验过,反馈说比GLM 5快多了,不那么爱拍马屁,推理意图的能力很强,语义推理也有提升,整体感觉像Opus。看来又一个强力模型要加入战场了,AI模型的军备竞赛真是一刻都不停啊。

关键词: Pony Alpha 2 GLM 5 模型发布 推理能力
来源: @nummanali
链接: x.com/nummanali/s…

产品发布

Claude推出交互式图表和示意图功能

Claude现在可以直接在聊天中生成交互式图表和示意图啦!这次更新对所有套餐开放,包括免费用户也能体验。想象一下,以后做数据可视化、画流程图、展示复杂概念,直接在对话框里就能搞定,还能实时交互调整。这个功能在教育演示场景特别好用,一图胜千言,动图胜万言,Claude这波操作有点像当年Google的意思了。

关键词: Claude 交互式图表 数据可视化 免费功能
来源: @yanhua1010
链接: x.com/yanhua1010/…

研究论文

Google推出Aletheia数学问题求解系统

Google研究人员搞了个叫Aletheia的智能体系统,基于Gemini 3 Deep Think驱动,专门用来生成、验证和修正复杂数学问题的解决方案。这系统已经为研究论文做出贡献,还产出了几个长期悬而未决的Erdős问题的新颖解法。看来AI不仅能写代码,现在连数学难题都开始攻克了,数学家们要加油了!

关键词: Google Aletheia Gemini 数学问题 AI推理
来源: @DeepLearningAI
链接: x.com/DeepLearnin…

AgeMem框架:让AI主动管理记忆

AgeMem是一个新框架,把记忆管理变成了智能体决策过程的一部分。它统一了短期记忆和长期记忆,让智能体可以主动选择存储信息、检索记忆、更新总结或丢弃无用信息,就像使用工具一样。这种设计帮助智能体在有限的上下文窗口下处理更长更复杂的任务。想象一下,AI不再是被动接受信息,而是能主动决定记住什么、忘记什么,这感觉有点像人类的记忆机制了。

关键词: AgeMem 记忆管理 智能体 长期记忆
来源: @TheTuringPost
链接: x.com/TheTuringPo…

Answer.ai研究:Python包发布与生产力

Answer.ai的新研究探讨了Python包发布是否带来了明显的生产力提升。结论是:没有。研究告诉我们放轻松,你并没有错过一个所有人都被邀请的派对。这个研究挺有意思的,提醒我们不要盲目追新,工具再多,关键还是要找到适合自己的。

关键词: Python 生产力 开发工具 研究报告
来源: @jeremyphoward
链接: x.com/jeremyphowa…

工具推荐

Claude Code成功移植经典屏保Pipes

有人用Claude Code把经典的pipes屏保移植到Mac上,还打包成了屏保程序,整个过程几乎不需要人工干预。这展示了AI编程工具的实力——不仅能写新代码,还能处理移植、打包这种需要理解多个系统的复杂任务。看来以后移植老项目、适配新平台这种活,AI也能帮上大忙了。

关键词: Claude Code 屏保 代码移植 Mac
来源: @typedfemale
链接: x.com/typedfemale…

OpenClaw-RL:用对话训练智能体

OpenClaw-RL让你可以通过对话来训练智能体,你的下一条消息就是智能体学习先前行为的反馈。这种交互式训练方式比传统的强化学习更直观,就像教小孩一样,做对了夸一句,做错了指出来,智能体就能不断改进。这种人机协作的训练方式可能会让AI训练变得更加平民化。

关键词: OpenClaw-RL 智能体训练 强化学习 对话式训练
来源: @dongxi_nlp
链接: x.com/dongxi_nlp/…

行业动态

Cursor两位核心高管跳槽xAI

重磅人事变动!Cursor的工程负责人Andrew Milich和产品负责人Jason Ginsberg宣布加入马斯克的xAI,直接向老马汇报。这俩可是把Cursor从零做到20亿美元年化收入的操盘手,经手了几乎所有关键产品。现在AI编程市场已经超过50亿美元,Cursor 20亿、Claude Code 25亿、GitHub Copilot 10亿,各家都在印钞,唯独xAI还没入场。看来马斯克这是要认真做AI编程产品了。

关键词: Cursor xAI 马斯克 AI编程 人才流动
来源: @dotey
链接: x.com/dotey/statu…

Cursor团队自建CursorBench测评体系

公开benchmark已经测不出模型差距了!Cursor团队发博客解释为什么要自己做CursorBench。问题出在三个地方:任务场景不对齐、评分标准不准确、数据污染严重。OpenAI甚至直接不报SWE-bench分数了,因为模型能直接背出答案。Cursor的做法是用内部代码库生成真实请求,每几个月刷新一次。结果是公开榜单上模型分数越挤越近,但CursorBench的排名跟开发者真实体验高度吻合。

关键词: Cursor benchmark 模型评测 SWE-bench
来源: @chenchengpro
链接: x.com/chenchengpr…

OCR技术的AI革命

传统OCR技术已经存在30年了,但一直依赖模式匹配或专用ML模型,需要不断调整模板,遇到各种文档就容易翻车。现在视觉模型的通用准确率高多了,能处理各种长尾文档。这意味着PDF数字化、文档识别这些老大难问题,终于有了更靠谱的解决方案。AI不是在重新发明轮子,而是把轮子升级成了磁悬浮。

关键词: OCR 视觉模型 文档识别 PDF数字化
来源: @jerryjliu0
链接: x.com/jerryjliu0/…

Perplexity Computer将成为企业AI入口

Slack正在成为企业AI的主要界面,而Perplexity Computer非常自然地融入了这个界面。未来的多亿甚至万亿美元公司都会在Slack上运行,而且会把越来越多的任务委托给AI而不是人类。这个预测挺大胆的,但想想也有道理——企业沟通已经在Slack上了,AI直接接入不是很自然吗?

关键词: Perplexity Slack 企业AI 工作流
来源: @AravSrinivas
链接: x.com/AravSriniva…

AI发展速度的误解

AI领域最大的误解之一是认为机器学习世界发展极快。但了解硬件和软件彩票的人都知道,规模化方法的前沿往往落后于最佳已知研究好几年。这提醒我们,AI的进步不是线性的,从研究到实际应用有很长的路要走。所以别焦虑,你没有落后那么多。

关键词: AI发展 机器学习 研究应用 技术落差
来源: @lateinteraction
链接: x.com/lateinterac…


关注我,每天获取AI最新资讯。