ChatGPT与大模型研究

ChatGPT与大模型研究

ChatGPT与大模型研究

生成式AI探索和研究，场景落地。

等 151 人订阅共890篇文章创建于2023-05-22

当 AI 自己写不好代码时，问题可能出在你的"工具架"上

最近 Anthropic 工程团队发了一篇博文，标题叫《Harness design for long-running application development》。这篇文章表面上是在讲他们怎么让

2月前
122
1
评论

当 AI 自己写不好代码时，问题可能出在你的"工具架"上

AI Agent 的记忆力之战：为什么架构比模型大小更重要

最近在做一个跨会话的客服 Agent 项目时，我踩了一个大坑。Agent 在单轮对话里表现很好，但一旦对话跨越多个 session——用户上周提过的偏好、三天前反馈的 bug、上个月确认的需求——Ag

2月前
204
点赞
评论

AI Agent 的记忆力之战：为什么架构比模型大小更重要

MLX-LM 深度拆解：苹果亲儿子框架凭什么比 Ollama 快一倍

第一次对 MLX 产生"这东西不一样"的感觉，是在 M4 Max 上跑 Qwen 3.5 35B-A3B 那个 MoE 模型的时候。同一个模型，Ollama 跑出来大概 35 tok/s，切到 MLX

2月前
1.1k
点赞
评论

MLX-LM 深度拆解：苹果亲儿子框架凭什么比 Ollama 快一倍

Ollama 深度拆解：从一行命令跑大模型到本地 AI 基础设施

2023 年中，我第一次在终端里敲下 ollama run llama2 的时候，其实没什么特别的期待——当时本地跑大模型的工具一大把，大部分都需要你跟 Python 环境、CUDA 版本、模型格式转

2月前
405
点赞
评论

Ollama 深度拆解：从一行命令跑大模型到本地 AI 基础设施

GEO 深度拆解：当 AI 重写搜索规则，你的内容如何被"选中"

我最早注意到 GEO 这个词，是 2024 年初在 arXiv 上读到普林斯顿那篇论文的时候。当时觉得"又一个造词运动"，没太当回事。直到 2025 年下半年，我负责的一个技术博客流量开始出现诡异的变

2月前
180
点赞
评论

GEO 深度拆解：当 AI 重写搜索规则，你的内容如何被"选中"

2026 年 AI 编程的真正分水岭：不是“更会想”，而是“能在环境里持续行动”

很多人还在用 2024 年的视角理解 AI 编程：谁补全更准，谁解释代码更快，谁能把函数一次写对。这个视角已经不够用了。到了 2026 年，行业真正的分水岭，已经不是“模型会不会推理”，而是模型能不能

2月前
435
点赞
评论

2026 年 AI 编程的真正分水岭：不是“更会想”，而是“能在环境里持续行动”

通用机器人基础模型走不通？VLA 的数据死结与模块化破局之路

一、VLA 是什么：机器人的"大语言模型时刻" 1.1 从感知到行动的范式跃迁传统机器人系统是模块化管线：感知模块识别物体 → 规划模块计算路径 → 控制模块执行动作。每个模块之间用手工定义的接口连

2月前
134
点赞
评论

通用机器人基础模型走不通？VLA 的数据死结与模块化破局之路

Claude Code 实战笔记：能力边界、使用方法和团队落地建议

过去一年，如果你经常写代码，大概率已经被各种 AI Coding 工具教育过一轮了。最开始大家关注的是补全。后来开始比谁能改代码、谁能解释报错、谁能生成函数。再往后，工具开始支持 Agent、支

2月前
291
点赞
评论

Claude Code 实战笔记：能力边界、使用方法和团队落地建议

从"推理思考"到"智能体思考"：AI 范式迁移的深度解读与产业验证

引言：一篇值得认真对待的文章 AI 圈从来不缺趋势判断和宏大叙事。但这篇文章不一样。它的作者林俊旸是 Qwen3 的核心训练者之一——不是在旁边评论的分析师，而是亲手训练过前沿模型、踩过真实的坑、做

2月前
209
点赞
评论

从"推理思考"到"智能体思考"：AI 范式迁移的深度解读与产业验证

Cursor 深度解析：从 AI 代码编辑器到自驱动代码库的进化之路

一、来龙去脉：四个 MIT 学生如何掀翻编辑器市场 1.1 创始团队与初心 Cursor 的母公司 Anysphere 成立于 2022 年，由四位 MIT 校友联合创办：Michael Truell

2月前
815
1
1

Cursor 深度解析：从 AI 代码编辑器到自驱动代码库的进化之路

NVIDIA 的 AI Agent 连续自主优化 7 天，写出的 GPU 内核打败了所有人类专家

这条推文背后的故事比它说的更疯狂几天前，NVIDIA 的 Terry Chen 在推特上发了一段话，大意是：他还提到一个概念叫 "blind coding"（盲编码） ——他和同事 Bing Xu

2月前
101
点赞
评论

NVIDIA 的 AI Agent 连续自主优化 7 天，写出的 GPU 内核打败了所有人类专家

谷歌 TurboQuant 深度拆解：LLM 内存压缩 6 倍、推理加速 8 倍、零精度损失，它是怎么做到的？

昨天互联网炸了 2026 年 3 月 24 日，谷歌研究院发了一篇不太起眼的博客，配了一个彩色方块的动图。24 小时内，相关推文获得了 1190 万次浏览。Cloudflare CEO Matthew

2月前
1.3k
点赞
评论

谷歌 TurboQuant 深度拆解：LLM 内存压缩 6 倍、推理加速 8 倍、零精度损失，它是怎么做到的？

AI Agent 深度拆解：前沿、落地、成长路径与未来，一篇讲透

为什么我要写这篇文章 2025 年底，我在看 Anthropic 的一份安全报告时被一个细节震到了——一次由国家支持的网络攻击中，AI Agent 独立执行了 80% 到 90% 的攻击操作，速度远超

2月前
224
点赞
评论

AI Agent 深度拆解：前沿、落地、成长路径与未来，一篇讲透

我花了两个月摸透 Vibe Coding，这是我踩过的坑和总结出的方法论

起因：一个让我焦虑的数字前段时间看到一个数据，Google Cloud 的报告说，大厂里超过 41% 的代码现在是 AI 生成的。2023 年这个数字还不到 5%。再看看 YC 的 W25 批次，

2月前
447
点赞
评论

我花了两个月摸透 Vibe Coding，这是我踩过的坑和总结出的方法论

知识图谱 × 大语言模型：2025-2026 融合前沿全景与六大创新机会

写在前面 LLM 很强，但它「记不住」也「不靠谱」——幻觉、知识过时、推理不可追溯，这些老问题到今天也没被根本解决。知识图谱（KG）很准，但它「建不动」也「用不活」——构建成本高、覆盖不完整、难以与

2月前
565
1
评论

知识图谱 × 大语言模型：2025-2026 融合前沿全景与六大创新机会

用 Figma 设计并制作界面原型——使用 Auto Layout 创建响应式移动界面

在上一章中，你已经开始了从 lo-fi 到 hi-fi 的过渡，而这也标志着我们的旅行规划应用正式进入实际的视觉设计阶段。到了这个阶段，保持专注、精确和有意识地设计就变得非常重要，因为你的高保真界面稿

2月前
225
点赞
评论

用 Figma 设计并制作界面原型——使用 Auto Layout 创建响应式移动界面

用 Figma 设计并制作界面原型——使用网格、颜色与排版进行一致性设计

你已经走了很长一段路！在完成第一批线框图之后，你现在已经准备好把关注点从“结构”转向“风格”了。在这一章中，你将开始塑造应用的整体观感，学习如何使用网格、色板、字体排印以及视觉效果。这些元素对于构建一

2月前
188
点赞
评论

用 Figma 设计并制作界面原型——使用网格、颜色与排版进行一致性设计

用 Figma 设计并制作界面原型——采用矢量形状，以移动优先方式进行线框设计

你已经走到了这样一个阶段：无论是 UX 流程，还是 Figma 的界面，你都已经具备了扎实的理解。现在，是时候把这些内容真正整合起来，开始设计我们这款旅行规划应用的用户界面（UI）了。将 UX 阶段产

2月前
172
点赞
评论

用 Figma 设计并制作界面原型——采用矢量形状，以移动优先方式进行线框设计

用 Figma 设计并制作界面原型——熟悉你的设计环境

在上一章中，我们探讨了 UX 流程中的基础要素，包括情绪板、用户画像和用户流程——这些都是塑造有意义且可用体验时不可或缺的工具。随着你继续往前推进，务必要把你的研究材料、洞察结论和规划资产放在触手可及

2月前
174
点赞
评论

用 Figma 设计并制作界面原型——熟悉你的设计环境