LLM

LLM

LLM

深入探讨PyTorch、TensorFlow框架在大规模语言模型（LLM）领域的应用与优化，为读者提供前沿的技术洞见和实用的开发经验。

等 51 人订阅共68篇文章创建于2024-02-04

我把设计稿扔给 Doubao-Seed-Code，它写出的前端页面让我怀疑人生

过去几年，前端开发的节奏一直在悄悄发生变化：从「组件开发 → 低代码 → 设计稿转代码工具」一路往前推进，但始终有一道过不去的坎——模型看不懂设计稿，只能看懂语言。这意味着我们依然要靠开发者手工理解

12天前
1.4k
9
4

我把设计稿扔给 Doubao-Seed-Code，它写出的前端页面让我怀疑人生

本地模型 + 云端模型的 Hybrid Inference 架构设计：下一代智能系统的底层范式

过去一年，大模型的推理方式正在变得前所未有地多样化。开发者不再满足于“把请求丢给云端 API，然后等待结果”这种单向流程，而是真实地感受到：不同场景，对延迟、隐私、成本、可控性都有完全不同的要求。尤其

19天前
78
1
评论

本地模型 + 云端模型的 Hybrid Inference 架构设计：下一代智能系统的底层范式

文心 5.0：原生全模态时代的技术分水岭

过去两年，大模型领域，我们见到无数号称“多模态”的模型，但绝大多数都停留在“能力堆叠”，而不是真正的“感知一致”。通常的处理方式就是图像模型输出 embed

21天前
704
14
评论

文心 5.0：原生全模态时代的技术分水岭

被权重出卖的“脏数据”：GPT-oss 揭开的 OpenAI 中文训练真相

前段时间，OpenAI 为展示开源诚意，公开了 GPT-oss 的全部模型参数。结果没想到，这件事反倒像一次“体检报告公开”。一些开发者顺着权重数据深挖，反向分析出了模型训练阶段“吃进去”的各种素材，

26天前
192
2
评论

被权重出卖的“脏数据”：GPT-oss 揭开的 OpenAI 中文训练真相

AI 生成代码，从 Copilot 到 Claude Code 的全景测评

AI 生成代码工具正在经历一场显著的流行与普及浪潮。几乎每周业界都会有新的工具发布或宣布上线......

27天前
455
2
评论

AI 生成代码，从 Copilot 到 Claude Code 的全景测评

使用 Chrome 内置 AI API 构建翻译 Demo

六月份参加 Google I/O Connect 和 Google Developer Expert 峰会后，我写过一篇关于 Chrome 内置 AI API 的文章，其中介绍了 Summarizer

1月前
256
6
评论

使用 Chrome 内置 AI API 构建翻译 Demo

Cursor 2.0 转向多智能体 AI 编程，并发布 Composer 模型

Cursor 发布了最新一代 AI 软件开发平台，引入全新的多智能体交互界面，并正式推出自研编码模型 Composer。新模型 Composer 被描述为一款“前沿模型”。Cursor 声称，它在同

1月前
388
4
评论

Cursor 2.0 转向多智能体 AI 编程，并发布 Composer 模型

GitHub 发布 Agent HQ：欢迎回家，智能体们

当前的 AI 领域正面临一个我们再熟悉不过的挑战：强大的能力被割裂在不同的工具与界面之中。在 GitHub，我们一直致力于解决这种系统性难题——让 Git 更易用，让代码评审通过 Pull

1月前
228
1
评论

GitHub 发布 Agent HQ：欢迎回家，智能体们

从“打标签”到“算行为”：抖音推荐系统的进化逻辑（附打分算法深度解析）

打标签的时代为什么结束了？在推荐系统的早期，世界是用“标签”来描述的。每个用户被贴上“爱美食”“爱旅行”“爱萌宠”的标签，每条内容也被分入“搞笑”“街舞”“Vlog”的类别。系统通过简单的“用户

1月前
339
4
2

从“打标签”到“算行为”：抖音推荐系统的进化逻辑（附打分算法深度解析）

大模型嵌入浏览器，Atlas 和 Gemini 将带来怎样的变革？

大模型时代，过去上网查资料，我们大多经历过这样的场景：一边在浏览器里打开一堆网页寻找信息，一边又得切换到聊天机器人窗口去提问。比如看到一篇复杂的技术文章不太明白，我们可能复制一段粘贴给 ChatGP

1月前
211
1
评论

大模型嵌入浏览器，Atlas 和 Gemini 将带来怎样的变革？

Seedream 4.0 测评：对飙 Nano Banana 生图，真的强！

9 月 11 日晚，字节跳动正式发布豆包·图像创作模型 Seedream 4.0。这不仅是一次常规的迭代更新，更是一次针对创作者群体的全面升级：支持 4K 超高清，推理速度提升超 10 倍，在 A

2月前
474
2
评论

Seedream 4.0 测评：对飙 Nano Banana 生图，真的强！

文心快码 3.5S：多智能体自协同，引爆开发者新范式

前两天发了一篇关于《我的疑问：为什么 Anthropic（Claude） CEO 敌意这么大？！》的讨论，引起一些热议，原来 Anthropic 老板最开始也曾是百度海外的实习生；不管怎么说，“百度是

2月前
250
4
评论

文心快码 3.5S：多智能体自协同，引爆开发者新范式

GPT-5 发布：把模型的“切换权”还给模型自己！

就在昨晚！OpenAI 正式发布 GPT-5，并把它设为 ChatGPT 的默认模型。这一代的变化不是“再大一点的模型”，而是把快模型 + 深度推理模型 + 实时路由器整合成一个统一系统：能判

4月前
479
1
评论

GPT-5 发布：把模型的“切换权”还给模型自己！

python 代码实战详解：金融风控场景下的大模型挑战

在金融风控这一对准确性、可解释性要求极高的领域，我们会发现通用大模型往往"力不从心"。想象这样一个场景：某银行的信贷风控系统需要评估一笔企业贷款申请。系统需要分析企业的财务报表、现金流预测、行业风

4月前
271
4
评论

python 代码实战详解：金融风控场景下的大模型挑战

大模型为何迟迟无法真正融入微信？

当所有人都在谈论 AI 如何改变世界的时候，我们却发现一个有趣的现象：拥有 13 亿用户的微信，至今仍然是一个相对"传统"的社交平台。ChatGPT 火了两年，Claude、GPT-4 轮番上阵，但微

4月前
3.8k
12
43

大模型为何迟迟无法真正融入微信？

AI 的十年周期规律：从专家系统到大模型，下一步是什么？

从 1980 年的专家系统，到 2023+ 年的大模型浪潮，AI 每十年一次“轮回”，技术更迭，范式切换。我们站在又一次临界点上，必须思考：下一步，到底是什么？ ⏳ 一、40年简史：AI 每十年一次范

4月前
270
2
2

AI 的十年周期规律：从专家系统到大模型，下一步是什么？

Cursor 发布 Web 和移动端 Agent：随时随地，开启编程！

Cursor 官方6.30日宣布，其智能编程助手正式登陆 Web 和移动端。开发者无需再局限于本地 IDE，无论是在电脑浏览器，还是在手机和平板上，Cursor Agent 都可以随时随地协助完成编码

5月前
934
6
评论

Cursor 发布 Web 和移动端 Agent：随时随地，开启编程！

百度文心4.5系列正式开源：国产大模型走到了世界牌桌正中央

2024年，DeepSeek R1 一战成名；2025年，OpenAI 不再嘴硬，终于也开始试探性地“Open”；谷歌一边推进 Gemini，一边推出轻量化的开源多模态 Gemma 系列……AI大模型

5月前
737
9
4

百度文心4.5系列正式开源：国产大模型走到了世界牌桌正中央

换了无数键盘、工学椅，却从没认真选过一块为程序员“注意力”设计的屏

注意力就是生产力大模型的时代，我们意识到“自注意力”这件事情是最宝贵的！模型需要注意力，人更需要！对程序员来说，写代码早已不是靠蛮力敲键盘，大模型能帮我们生成代码没错，但更依赖靠脑中的线程稳定运

5月前
1.2k
11
2

换了无数键盘、工学椅，却从没认真选过一块为程序员“注意力”设计的屏

又有新的大模型训练策略啦？

过去两年，对齐技术像被按下快进键：RLHF 让模型首次听懂“好坏”，DPO 把训练成本打五折，RLAIF 把标注员换成 GPT-4，Constitutional AI 甚至给模型立了一部“宪法”。

5月前
217
2
评论