获得徽章 24
#挑战每日一条沸点#
50 位来自字节、阿里、腾讯等机构的 AI 研究员,联合发布了一份 300 页的论文,里面有些关于代码模型和 Agent 的结论,挺出人意料。
- 小模型也能打败大厂的专有模型
- 模型学 Python 有点吃力
- 语言之间有差异(代码 Scaling Laws)
- MoE vs Dense(能力 vs 稳定性)
- 代码模型默认是「不安全」的
- 结构比内容更重要
文章源地址:
arxiv.org
50 位来自字节、阿里、腾讯等机构的 AI 研究员,联合发布了一份 300 页的论文,里面有些关于代码模型和 Agent 的结论,挺出人意料。
- 小模型也能打败大厂的专有模型
- 模型学 Python 有点吃力
- 语言之间有差异(代码 Scaling Laws)
- MoE vs Dense(能力 vs 稳定性)
- 代码模型默认是「不安全」的
- 结构比内容更重要
文章源地址:
展开
1
1
#挑战每日一条沸点#
DeepSeek-V3.2在推理能力上追平 GPT-5-High,在部分指标上超越
DeepSeek-V3.2-Speciale(高算力版)
在 2025 年 IMO 和 IOI 拿了金牌,推理能力接近 Gemini-3.0-Pro
DeepSeek-V3.2在推理能力上追平 GPT-5-High,在部分指标上超越
DeepSeek-V3.2-Speciale(高算力版)
在 2025 年 IMO 和 IOI 拿了金牌,推理能力接近 Gemini-3.0-Pro
展开
评论
点赞
#挑战每日一条沸点#
如果说2024年是模型的“参数之战”,那么站在2025年末回望,中国AI战场已演变为一场关于资本效率、基础设施霸权与流量入口的路线之争。
11月27日,高盛发布了一份关于中国互联网与人工智能发展的重磅研报,对当前中国AI行业“大厂之战”的激烈战况进行了分析,对阿里巴巴、字节跳动、腾讯的不同战略选择进行了解读:
阿里巴巴选择了最“重”的道路,以同比暴增80%的资本开支和全栈布局,试图用重资产构筑类似谷歌的“全栈”壁垒,成为中国AI市场的“全栈霸主”;
字节跳动凭借恐怖的流量优势,以日均30万亿Token的消耗量,在应用层大杀四方;
腾讯则保持了其一贯的克制,在收缩资本开支的同时,更专注于将AI能力“无缝嵌入”其庞大的社交与支付生态。
如果说2024年是模型的“参数之战”,那么站在2025年末回望,中国AI战场已演变为一场关于资本效率、基础设施霸权与流量入口的路线之争。
11月27日,高盛发布了一份关于中国互联网与人工智能发展的重磅研报,对当前中国AI行业“大厂之战”的激烈战况进行了分析,对阿里巴巴、字节跳动、腾讯的不同战略选择进行了解读:
阿里巴巴选择了最“重”的道路,以同比暴增80%的资本开支和全栈布局,试图用重资产构筑类似谷歌的“全栈”壁垒,成为中国AI市场的“全栈霸主”;
字节跳动凭借恐怖的流量优势,以日均30万亿Token的消耗量,在应用层大杀四方;
腾讯则保持了其一贯的克制,在收缩资本开支的同时,更专注于将AI能力“无缝嵌入”其庞大的社交与支付生态。
展开
评论
2
#挑战每日一条沸点#
Multi-Agent 系统是靠单个 agent 单打独斗,而是组建一支专业 agent 构成的团队,每个 agent 都有自己的工具、上下文和任务。
通过明确分工,这些 agent 可以互相协作、辩论,不断优化彼此的输出,从而解决单个 agent 无法搞定的难题。Agent 在你的 AI 系统中扮演协调者的角色。
它们不会取代 query rewriting 或 chunking 等技术,而是智能地编排这些技术。比如:
• 初始搜索失败时,agent 可能会应用 query rewriting
• 根据内容类型,选择不同的 chunking 策略
• 决定何时压缩对话历史,为新信息腾出空间
Multi-Agent 系统是靠单个 agent 单打独斗,而是组建一支专业 agent 构成的团队,每个 agent 都有自己的工具、上下文和任务。
通过明确分工,这些 agent 可以互相协作、辩论,不断优化彼此的输出,从而解决单个 agent 无法搞定的难题。Agent 在你的 AI 系统中扮演协调者的角色。
它们不会取代 query rewriting 或 chunking 等技术,而是智能地编排这些技术。比如:
• 初始搜索失败时,agent 可能会应用 query rewriting
• 根据内容类型,选择不同的 chunking 策略
• 决定何时压缩对话历史,为新信息腾出空间
展开
评论
点赞
#挑战每日一条沸点# Base 成都,组内释放后端HC,AI Agent 应用开发方向,月薪15-35k (年终奖另算),有没有看机会的,快速入职,最好是5年以上练习生。求推荐
~~~
~~~
1
1
#挑战每日一条沸点#
github.com
基于大模型和RAG的一款智能text2sql系统:SQLBot,可以帮你用自然语言查询数据库
它可以把问题转换成数据库能理解的SQL语句,再去数据库里执行查询,然后生成数据图表及分析
获得基础图表结果后,支持进一步分析、解释、验证以及预测,也可以把多个问答对话构建成一个数据看板
开箱即用,配置模型和数据源即可
支持嵌入到第三方业务系统,也支持被n8n、MaxKB、Dify、Coze 等AI应用平台集成调用
基于大模型和RAG的一款智能text2sql系统:SQLBot,可以帮你用自然语言查询数据库
它可以把问题转换成数据库能理解的SQL语句,再去数据库里执行查询,然后生成数据图表及分析
获得基础图表结果后,支持进一步分析、解释、验证以及预测,也可以把多个问答对话构建成一个数据看板
开箱即用,配置模型和数据源即可
支持嵌入到第三方业务系统,也支持被n8n、MaxKB、Dify、Coze 等AI应用平台集成调用
展开
评论
点赞
#挑战每日一条沸点# 2025 AI Agents 发展方向:
自主检索增强生成 (Agentic RAG)
基于推理的,用于实时数据检索和生成的AI智能体工作流。
Agentic RAG的应用不局限于单一场景,同样也被应用于医疗保健领域。
举例:Perplexity, Harvey AI 和 Glean AI
语音智能体 (Voice Agents)
能够通过自然口语与用户互动的智能代理,利用广泛的文本转语音(TTS)和语音转文本(STTS)的嵌入和检索技术。
举例:ElevenLabs, Cognigy, Vapi 和 Deepgram
AI智能体协议 (AI Agent Protocols)
简化多智能体之间的通信,支持不同框架下构建的智能体之间的交流。
举例:Accenture,A2A, ACP, SLIM等
计算机使用智能体 (CUA - Computer Using Agents)
能像人类一样与计算机交互的AI智能体,可利用浏览器、命令行界面(CLI)甚至鼠标光标等工具。
举例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI
编程智能体 (Coding Agents)
借助巧妙的工具使用和基于大语言模型(LLM)的代码生成,使构建和调试应用程序的速度提高10倍的多智能体。
举例:Windsurf, Cursor 和 GitHub Copilot
(图片来自:rakeshgohel01)
基于推理的,用于实时数据检索和生成的AI智能体工作流。
Agentic RAG的应用不局限于单一场景,同样也被应用于医疗保健领域。
举例:Perplexity, Harvey AI 和 Glean AI
能够通过自然口语与用户互动的智能代理,利用广泛的文本转语音(TTS)和语音转文本(STTS)的嵌入和检索技术。
举例:ElevenLabs, Cognigy, Vapi 和 Deepgram
简化多智能体之间的通信,支持不同框架下构建的智能体之间的交流。
举例:Accenture,A2A, ACP, SLIM等
能像人类一样与计算机交互的AI智能体,可利用浏览器、命令行界面(CLI)甚至鼠标光标等工具。
举例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI
借助巧妙的工具使用和基于大语言模型(LLM)的代码生成,使构建和调试应用程序的速度提高10倍的多智能体。
举例:Windsurf, Cursor 和 GitHub Copilot
(图片来自:rakeshgohel01)
展开
评论
1
赞了这篇文章
#挑战每日一条沸点#
发现了个好东西!美国东北大学的一篇论文《大语言模型基础》详细介绍了大语言模型训练中的理论基础、关键技术和应用方法,非常适合初学者
主要目录为预训练、生成模型、提示工程、对齐和推理
- 原始论文:
arxiv.org
- 双语版下载:
pan.quark.cn
发现了个好东西!美国东北大学的一篇论文《大语言模型基础》详细介绍了大语言模型训练中的理论基础、关键技术和应用方法,非常适合初学者
主要目录为预训练、生成模型、提示工程、对齐和推理
- 原始论文:
- 双语版下载:
展开
评论
点赞
评论
5
2
3
![[思考]](http://lf-web-assets.juejin.cn/obj/juejin-web/xitu_juejin_web/img/jj_emoji_15.f58c082.png)