获得徽章 24
#挑战每日一条沸点#
50 位来自字节、阿里、腾讯等机构的 AI 研究员,联合发布了一份 300 页的论文,里面有些关于代码模型和 Agent 的结论,挺出人意料。

- 小模型也能打败大厂的专有模型
- 模型学 Python 有点吃力
- 语言之间有差异(代码 Scaling Laws)
- MoE vs Dense(能力 vs 稳定性)
- 代码模型默认是「不安全」的
- 结构比内容更重要

文章源地址:arxiv.org
展开
青Cheng序员石头于2025-12-04 14:13发布的图片
青Cheng序员石头于2025-12-04 14:13发布的图片
1
#挑战每日一条沸点#

DeepSeek-V3.2在推理能力上追平 GPT-5-High,在部分指标上超越

DeepSeek-V3.2-Speciale(高算力版)
在 2025 年 IMO 和 IOI 拿了金牌,推理能力接近 Gemini-3.0-Pro
展开
青Cheng序员石头于2025-12-02 14:22发布的图片
评论
#挑战每日一条沸点#
在这个充满变化的时代,我们需要的不是对未来的精准预测,而是面对不确定性时的从容态度。
青Cheng序员石头于2025-12-01 18:44发布的图片
1
#挑战每日一条沸点#

如果说2024年是模型的“参数之战”,那么站在2025年末回望,中国AI战场已演变为一场关于资本效率、基础设施霸权与流量入口的路线之争。

11月27日,高盛发布了一份关于中国互联网与人工智能发展的重磅研报,对当前中国AI行业“大厂之战”的激烈战况进行了分析,对阿里巴巴、字节跳动、腾讯的不同战略选择进行了解读:

阿里巴巴选择了最“重”的道路,以同比暴增80%的资本开支和全栈布局,试图用重资产构筑类似谷歌的“全栈”壁垒,成为中国AI市场的“全栈霸主”;

字节跳动凭借恐怖的流量优势,以日均30万亿Token的消耗量,在应用层大杀四方;

腾讯则保持了其一贯的克制,在收缩资本开支的同时,更专注于将AI能力“无缝嵌入”其庞大的社交与支付生态。
展开
青Cheng序员石头于2025-11-30 16:52发布的图片
评论
#挑战每日一条沸点#

Multi-Agent 系统是靠单个 agent 单打独斗,而是组建一支专业 agent 构成的团队,每个 agent 都有自己的工具、上下文和任务。
通过明确分工,这些 agent 可以互相协作、辩论,不断优化彼此的输出,从而解决单个 agent 无法搞定的难题。Agent 在你的 AI 系统中扮演协调者的角色。

它们不会取代 query rewriting 或 chunking 等技术,而是智能地编排这些技术。比如:

• 初始搜索失败时,agent 可能会应用 query rewriting
• 根据内容类型,选择不同的 chunking 策略
• 决定何时压缩对话历史,为新信息腾出空间
展开
青Cheng序员石头于2025-11-29 10:41发布的图片
评论
#挑战每日一条沸点# [思考][思考][思考]
青Cheng序员石头于2025-11-25 23:09发布的图片
评论
#挑战每日一条沸点# 昨晚也是见证了Cloudflare全球史诗级故障了!
青Cheng序员石头于2025-11-19 09:31发布的图片
3
#挑战每日一条沸点# Base 成都,组内释放后端HC,AI Agent 应用开发方向,月薪15-35k (年终奖另算),有没有看机会的,快速入职,最好是5年以上练习生。求推荐[勾引]~~~
1
#挑战每日一条沸点# github.com

基于大模型和RAG的一款智能text2sql系统:SQLBot,可以帮你用自然语言查询数据库

它可以把问题转换成数据库能理解的SQL语句,再去数据库里执行查询,然后生成数据图表及分析

获得基础图表结果后,支持进一步分析、解释、验证以及预测,也可以把多个问答对话构建成一个数据看板

开箱即用,配置模型和数据源即可

支持嵌入到第三方业务系统,也支持被n8n、MaxKB、Dify、Coze 等AI应用平台集成调用
展开
青Cheng序员石头于2025-08-20 21:39发布的图片
评论
#挑战每日一条沸点# 2025 AI Agents 发展方向:

📌 自主检索增强生成 (Agentic RAG)
基于推理的,用于实时数据检索和生成的AI智能体工作流。
Agentic RAG的应用不局限于单一场景,同样也被应用于医疗保健领域。
举例:Perplexity, Harvey AI 和 Glean AI

📌 语音智能体 (Voice Agents)
能够通过自然口语与用户互动的智能代理,利用广泛的文本转语音(TTS)和语音转文本(STTS)的嵌入和检索技术。
举例:ElevenLabs, Cognigy, Vapi 和 Deepgram

📌 AI智能体协议 (AI Agent Protocols)
简化多智能体之间的通信,支持不同框架下构建的智能体之间的交流。
举例:Accenture,A2A, ACP, SLIM等

📌 计算机使用智能体 (CUA - Computer Using Agents)
能像人类一样与计算机交互的AI智能体,可利用浏览器、命令行界面(CLI)甚至鼠标光标等工具。
举例:OpenAI的Operator, Claude的Computer Use, H-Company的Runner H以及Manus AI

📌 编程智能体 (Coding Agents)
借助巧妙的工具使用和基于大语言模型(LLM)的代码生成,使构建和调试应用程序的速度提高10倍的多智能体。
举例:Windsurf, Cursor 和 GitHub Copilot

(图片来自:rakeshgohel01)
展开
青Cheng序员石头于2025-08-16 11:54发布的图片
评论
#挑战每日一条沸点#
发现了个好东西!美国东北大学的一篇论文《大语言模型基础》详细介绍了大语言模型训练中的理论基础、关键技术和应用方法,非常适合初学者
主要目录为预训练、生成模型、提示工程、对齐和推理


- 原始论文:arxiv.org
- 双语版下载:pan.quark.cn
展开
青Cheng序员石头于2025-08-04 11:50发布的图片
评论
#挑战每日一条沸点#

这个可以的,深入理解 LLM 核心原理,动手实现你的第一个大模型,Datawhale 开源免费电子书,非常简单好读。

datawhalechina.github.io
展开
青Cheng序员石头于2025-08-02 09:38发布的图片
评论
#挑战每日一条沸点# #配色生成器#

输入一个颜色,自动帮你生成一批好看的颜色,真的非常建议弄 AI 网站的同学不要再整那种蓝紫色的风格了。kigen.design
青Cheng序员石头于2025-07-29 18:26发布的图片
2
Top 10 Activities With Highest Al Penetration
青Cheng序员石头于2025-07-10 14:48发布的图片
评论
下一页
个人成就
优秀创作者
文章被点赞 5,759
文章被阅读 579,118
掘力值 18,547
收藏集
3
关注标签
25
加入于