Z°N VOYAGE WEEKLY
ISSUE #004
SYSTEM VERSION · v2026.4.0
RANGE: 04.06 — 04.12 · STATUS: PUBLISHED
"阅读喂养灵魂,代码筑造现实" —— Z°N
精读文章
你不知道的大模型训练:原理、路径与新实践
大模型训练已形成完整流水线,预训练只是知识底座,真正决定用户感知效果的是后训练、评测、奖励、Agent训练、蒸馏等后半段优化。训练过程包含数据工程、系统架构、后训练、评测反馈等多层耦合环节,1.3B参数模型经对齐优化可超越175B参数模型就是典型案例。2026年模型能力差距源于后半段训练栈的整体优化,而非单一预训练因素。
llm-wiki
LLM Wiki模式由Karpathy提出,旨在用LLM替代传统RAG实现知识累积。传统RAG每次查询需重新检索无沉淀;该模式让LLM摄入新文档时主动提取信息、整合更新实体页面、标注矛盾、建立跨文档关联,形成持续丰富的知识库。架构含三层:Raw sources为只读原始文档库;
Identify, solve, verify
随着大型语言模型编程能力提升,作者认为这反而减轻了职业焦虑,因为软件开发工作远不止编写代码。核心工作流程包括:识别可用代码解决的问题、解决这些问题、验证方案有效性。尽管更先进的LLM可能承担“解决”环节,但“发现问题”“定义问题”“确认问题已解决”仍依赖人类完成,这部分工作约占软件开发内容的80%,是专家的核心价值所在。
Don't Let AI Write For You
随着大型语言模型广泛应用,文章指出过度依赖LLM代写是错失深度思考和建立个人信任的机会。写作本质是通过解决问题、进入模糊地带并以结构化理解走出,从而提升认知水平,这一过程如同锻炼,是能力提升的必要努力,LLM代写则绕过了这种努力。在社会层面,LLM生成的文本削弱作者专业可信度,因其暗示内容非原创思考。
Code and Cake - Your job isn't programming
软件开发的核心挑战在于理解日益复杂的系统,单纯的技术方案如React迁移、微服务拆分或语言重写无法解决根本问题。文章指出真正的解决方案是抽象——隐藏不重要细节、强调重要概念的想法。好的抽象应改变程序员思考代码的方式,而不仅是增加间接层。设计抽象的思路包括:从业务中寻找发票、产品、客户等自然概念;数据是发现抽象的重要来源,因其常伴随修改规则;
The Unsustainability of Moore’s Law
摩尔定律面临物理、经济与工程三重限制。晶体管密度约每两年翻倍,但建厂成本约每五年翻倍,能制造的公司数量减半。25年间,建厂成本从20-40亿美元飙升至1000亿美元以上,全球仅剩2-3家企业具备先进制程能力。2纳米制程名不副实,传统栅极宽度已无法测量。晶体管密度达每平方毫米2-2.5亿个,栅极间距仅30-40纳米,受几何限制已达物理极限。
技术与生产力
Cypress
E2E 自动化测试
GSAP
动画引擎
markdown-it
Markdown 解析器
Pretext
从 Markdown 脚本生成高质感视频,适用于教程与演示录制。
ArcReel
AI 电影级视频生成工具,支持高品质的文生视频与图生视频。
Marp
基于 Markdown 的全套演示文稿生态系统,支持导出 PDF、PPT、HTML 等格式。
引用链接
[2] gist.github.com/karpathy/44…
[3] simonwillison.net/2025/Jul/4/…
[4] alexhwoods.com/dont-let-ai…
[5] codeandcake.dev/posts/2025-…
[7] www.npmjs.com/package/cyp…
[8] www.npmjs.com/package/gsa…
[9] www.npmjs.com/package/mar…
[12] marp.app/