首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
LLM
掘金安东尼
创建于2024-02-04
订阅专栏
深入探讨PyTorch、TensorFlow框架在大规模语言模型(LLM)领域的应用与优化,为读者提供前沿的技术洞见和实用的开发经验。
等 47 人订阅
共66篇文章
创建于2024-02-04
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
文心 5.0:原生全模态时代的技术分水岭
过去两年,大模型领域,我们见到无数号称“多模态”的模型,但绝大多数都停留在“能力堆叠”,而不是真正的“感知一致”。 通常的处理方式就是图像模型输出 embed
被权重出卖的“脏数据”:GPT-oss 揭开的 OpenAI 中文训练真相
前段时间,OpenAI 为展示开源诚意,公开了 GPT-oss 的全部模型参数。结果没想到,这件事反倒像一次“体检报告公开”。一些开发者顺着权重数据深挖,反向分析出了模型训练阶段“吃进去”的各种素材,
AI 生成代码,从 Copilot 到 Claude Code 的全景测评
AI 生成代码工具正在经历一场显著的流行与普及浪潮。几乎每周业界都会有新的工具发布或宣布上线......
使用 Chrome 内置 AI API 构建翻译 Demo
六月份参加 Google I/O Connect 和 Google Developer Expert 峰会后,我写过一篇关于 Chrome 内置 AI API 的文章,其中介绍了 Summarizer
Cursor 2.0 转向多智能体 AI 编程,并发布 Composer 模型
Cursor 发布了最新一代 AI 软件开发平台,引入全新的多智能体交互界面,并正式推出自研编码模型 Composer。 新模型 Composer 被描述为一款“前沿模型”。Cursor 声称,它在同
GitHub 发布 Agent HQ:欢迎回家,智能体们
当前的 AI 领域正面临一个我们再熟悉不过的挑战:强大的能力被割裂在不同的工具与界面之中。在 GitHub,我们一直致力于解决这种系统性难题——让 Git 更易用,让代码评审通过 Pull
从“打标签”到“算行为”:抖音推荐系统的进化逻辑(附打分算法深度解析)
打标签的时代为什么结束了? 在推荐系统的早期,世界是用“标签”来描述的。每个用户被贴上“爱美食”“爱旅行”“爱萌宠”的标签,每条内容也被分入“搞笑”“街舞”“Vlog”的类别。系统通过简单的“用户
大模型嵌入浏览器,Atlas 和 Gemini 将带来怎样的变革?
大模型时代,过去上网查资料,我们大多经历过这样的场景:一边在浏览器里打开一堆网页寻找信息,一边又得切换到聊天机器人窗口去提问。 比如看到一篇复杂的技术文章不太明白,我们可能复制一段粘贴给 ChatGP
Seedream 4.0 测评:对飙 Nano Banana 生图,真的强!
9 月 11 日晚,字节跳动正式发布 豆包·图像创作模型 Seedream 4.0。这不仅是一次常规的迭代更新,更是一次针对创作者群体的全面升级: 支持 4K 超高清,推理速度提升超 10 倍,在 A
文心快码 3.5S:多智能体自协同,引爆开发者新范式
前两天发了一篇关于《我的疑问:为什么 Anthropic(Claude) CEO 敌意这么大?!》的讨论,引起一些热议,原来 Anthropic 老板最开始也曾是百度海外的实习生;不管怎么说,“百度是
GPT-5 发布:把模型的“切换权”还给模型自己!
就在昨晚!OpenAI 正式发布 GPT-5,并把它设为 ChatGPT 的默认模型。 这一代的变化不是“再大一点的模型”,而是把快模型 + 深度推理模型 + 实时路由器整合成一个统一系统:能判
python 代码实战详解:金融风控场景下的大模型挑战
在金融风控这一对准确性、可解释性要求极高的领域,我们会发现通用大模型往往"力不从心"。 想象这样一个场景: 某银行的信贷风控系统需要评估一笔企业贷款申请。系统需要分析企业的财务报表、现金流预测、行业风
大模型为何迟迟无法真正融入微信?
当所有人都在谈论 AI 如何改变世界的时候,我们却发现一个有趣的现象:拥有 13 亿用户的微信,至今仍然是一个相对"传统"的社交平台。ChatGPT 火了两年,Claude、GPT-4 轮番上阵,但微
AI 的十年周期规律:从专家系统到大模型,下一步是什么?
从 1980 年的专家系统,到 2023+ 年的大模型浪潮,AI 每十年一次“轮回”,技术更迭,范式切换。我们站在又一次临界点上,必须思考:下一步,到底是什么? ⏳ 一、40年简史:AI 每十年一次范
Cursor 发布 Web 和移动端 Agent:随时随地,开启编程!
Cursor 官方6.30日宣布,其智能编程助手正式登陆 Web 和移动端。开发者无需再局限于本地 IDE,无论是在电脑浏览器,还是在手机和平板上,Cursor Agent 都可以随时随地协助完成编码
百度文心4.5系列正式开源:国产大模型走到了世界牌桌正中央
2024年,DeepSeek R1 一战成名;2025年,OpenAI 不再嘴硬,终于也开始试探性地“Open”;谷歌一边推进 Gemini,一边推出轻量化的开源多模态 Gemma 系列……AI大模型
换了无数键盘、工学椅,却从没认真选过一块为程序员“注意力”设计的屏
注意力就是生产力 大模型的时代,我们意识到“自注意力”这件事情是最宝贵的!模型需要注意力,人更需要! 对程序员来说,写代码早已不是靠蛮力敲键盘,大模型能帮我们生成代码没错,但更依赖靠脑中的线程稳定运
又有新的大模型训练策略啦?
过去两年,对齐技术像被按下快进键:RLHF 让模型首次听懂“好坏”,DPO 把训练成本打五折,RLAIF 把标注员换成 GPT-4,Constitutional AI 甚至给模型立了一部“宪法”。
从 0 构建 AI Demo?这份“云上 0 元清单”你值得拥有!
学习大模型相关技术,准备写个小应用跑通前后端、调用模型接口、做个简洁的可视化界面,但做到一半就卡住了—— 往往不是卡在代码,而是卡在基础设施。“服务器去哪开?云服务动不动就几百起步”
投篮左手不如右手,应该怎么练?机器学习“徐-罗奇定理”给出答案
最近参加一次关于“机器学习理论前沿”的专题讲座,听到了徐宗本院士分享的一段经历,其中提到他在误差建模领域的重要贡献——徐-罗奇定理 这是我第一次系统听说这个定理,但听完后,有种“原来一直在用,却不知道
下一页