首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
ChatGPT与大模型研究
数据智能老司机
创建于2023-05-22
订阅专栏
生成式AI探索和研究,场景落地。
等 151 人订阅
共883篇文章
创建于2023-05-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Transformers 权威指南——强化学习 Transformer
强化学习(RL)是一种基于“通过环境反馈来做序列决策”的范式。你仔细想想就会发现,通过交互来学习其实并不是什么新概念。事实上,你这一生都一直在接触 RL 的基本原则。因为很多时候,你就是通过和周围环境
Transformers 权威指南——从声音到 Token 再返回声音:音频领域中的 Transformer
这一章会带你沿着“维度轴”再往前走一步。你是从最原始的 Transformer——也就是语言——出发的,然后走到了时间序列;接着你又探索了视觉和视频;现在,你要进入音频领域了。先剧透一句:Transf
Transformers 权威指南——用于视频生成的 Transformer
这一章会是一段很有趣的旅程,因为到这里,你前面学过的很多东西会在当前最先进的文生视频(T2V)和图生视频(I2V)模型里真正汇合起来。你已经看到 ViT 如何把图像重组为 patch(“视觉模型中的嵌
Transformers 权威指南——用于图像生成的 Transformer
随着 DALL·E、Imagen、Midjourney 和 Stable Diffusion 等文生图(text-to-image, T2I)生成模型的发展,一个全新的逼真图像创作时代已经开启。这些模
Transformers 权威指南——用于视觉任务的 Transformer
Transformer 在这一领域中的一个巨大优势,是它具备 few-shot 和 zero-shot 学习能力。图像标注成本很高,而且很多场景里根本拿不到足够多的标签,比如癌症检测就是这样。能够用极
Transformers 权威指南——用于时间序列的 Transformer
Transformer 之所以在时间序列建模中越来越受欢迎,是因为它比循环神经网络(RNN)模型更擅长捕捉长序列中的交互关系。Transformer 中的自注意力机制允许序列中的每个元素直接关注其他所
Transformers 权威指南——从第一性原理到最先进的 Transformer
自 2017 年问世以来,Transformer 架构已经彻底改变了自然语言处理(NLP)领域,推动行业范式转向具备自然语言理解(NLU)能力的模型。之所以能实现这一转变,是因为 Transforme
我读了Claude Code的51万行源码(下):那些让我皱眉头的工程债
上一篇文章发出去之后,有不少朋友来问:这代码真的有那么厉害吗?Anthropic不是有100多亿美元的融资吗?代码质量应该很高吧? 我只能说——这个问题本身就暴露了一个常见误解:融资多不等于代码写得好
我读了Claude Code泄露的51万行源码,发现Anthropic在造一个"AI操作系统"
事情的起因 2026年3月31日,安全研究者 Chaofan Shou 在推上发了一条不起眼的帖子: 翻译成人话:Claude Code 的完整 TypeScript 源码,51.2万行,1903个文
从零开始构建一个推理模型——使用预训练好的 LLM 生成文本
本章内容包括 为使用 LLM 搭建代码环境 如何使用 tokenizer 为 LLM 准备输入文本 使用预训练 LLM 进行文本生成的逐步过程 用于加速 LLM 文本生成的缓存与编译技术 在上一章中,
从零开始构建一个推理模型——理解推理模型
本章内容包括 在 LLM 语境下,“推理”具体指什么 LLM 的常规预训练与后训练阶段 提升 LLM 推理能力的关键方法 推理与模式匹配有何不同 为什么我们要从零开始构建推理模型 欢迎来到大语言模型(
人类反馈强化学习实用指南——基于奖励建模的策略训练
在上一章中,我们讨论了 RLHF 的作用,以及如何通过多种方式将人类反馈纳入进来,以对齐 AI 策略并加速训练。其中一种非常实用的方法,是利用人类反馈训练一个奖励模型,再用这个奖励模型来引导智能体训练
人类反馈强化学习实用指南——人类反馈在强化学习中的角色
在本章中,我们将把关注重点转向人类反馈在强化学习(RL)中的作用,并从更宏观的角度来审视这一主题。在上一章中,我们已经说明了:与传统 RL 方法(例如 Q-learning)相比,带有人类反馈的强化学
人类反馈强化学习实用指南——强化学习导论
本书讨论的是如何让 AI 智能体与人类意图保持一致。过去二十年间,AI 能力呈指数级提升,而机器学习、计算机视觉、自然语言处理、深度学习以及强化学习(Reinforcement Learning,RL
Multimodal Lakehouse,不只是‘多模态 + 湖仓’
Multimodal Lakehouse,不只是“多模态 + 湖仓”:它到底在补哪条 AI 数据底座的断层? 这两年,很多团队一边在做多模态 RAG、视频理解、内容检索、Agent,一边又在补同一类基
AI Agent 创业,到底该往哪走?——方向、机会、陷阱与落地路径的深度拆解
为什么 Agent 创业看起来机会满地,真正下手时反而更迷茫 AI Agent 市场在 2025 年达到了 78.4 亿美元,预计 2030 年会突破 526 亿美元(41% 复合增长率)。CB In
AI 数据工程,究竟在重构什么?——一篇讲透 AI Data Engineering 的深度研究
为什么大家都在聊模型,但真正决定成败的是数据工程 一个典型的场景:团队花三个月搭了一套 RAG 系统——接了向量库,调了 embedding 模型,prompt 打磨了十几版,demo 环节效果惊艳。
Context Engineering 深度拆解:Agent 时代真正的胜负手
一、先讲清楚:Context Engineering 到底是个啥 2025 年 6 月,Shopify CEO Tobi Lütke 发了一条推:"我真的很喜欢 'context engineerin
我用了半年 OpenAI Codex,来聊聊这玩意到底行不行
〇、开篇先泼盆冷水 先说结论:Codex 很强,但没有任何一个 AI 编程工具是银弹。 社区里最真实的声音是这样的:有 Hacker News 用户吐槽"Codex 有时候会标记一个看起来很合理的数据
下一页