大模型真好玩

人工智能大模型 | alibaba

公众号：大模型真好玩。北京理工大学本硕，曾就职于字节阿里，目前在某大型国企研究大模型。分享最简洁最实用的人工智能大模型开发经验，看好未来世界人工智能大模型会和PC一样成为人手必备的工具！

赞

158

|

搜索文章

赞

文章( 154 ) 沸点( 4 )

大模型训练全流程实战指南工具篇（十）—— 小白也能懂的大模型训练参数万字详解

本文系统讲解LLaMAFactory的核心参数，涵盖全量训练、LoRA 对比、参数含义与调优、适配器合并导出，通过形象比喻帮助大家真正掌握大模型训练，从“能跑通”迈向“效果好、更可控”。

大模型真好玩
5天前
72
1
评论

大模型训练全流程实战指南工具篇（十）—— 小白也能懂的大模型训练参数万字详解

失业9个月，我成了公司老板：这并非运气，而是蓄谋已久

这不是一篇爽文，而是一个普通程序员在职业寒冬里的自救指南。如果你正处于焦虑中，或者也在寻找第二曲线，希望我的这段经历，能治愈你的精神内耗，带给你一点光。

后端小肥肠
3月前
2.4k
19
14

失业9个月，我成了公司老板：这并非运气，而是蓄谋已久

LangChain DeepAgents 速通指南（五）—— 快速了解DeepAgents框架及其核心特性

本文分享了DeepAgents框架的诞生背景与核心优势，并演示了其快速上手的完整流程。DeepAgents 在任务规划、上下文管理、子代理并行执行等方面展现出强大的能力，仅需少量代码即可构建复杂智能体

大模型真好玩
12天前
243
2
评论

LangChain DeepAgents 速通指南（五）—— 快速了解DeepAgents框架及其核心特性

大模型训练全流程实战指南工具篇（九）——LLamaFactory大模型训练工具使用指南

本期分享以LLaMAFactory大模型训练框架为例，从环境搭建到模型下载、数据准备、微调训练、权重合并及部署测试，完整演示了大模型训练的实战流程，充分展现了训练框架的极简操作和核心优势。

大模型真好玩
17天前
443
1
评论

大模型训练全流程实战指南工具篇（九）——LLamaFactory大模型训练工具使用指南

一文详解2026年技术圈最火概念——Agent Engineering智能体工程

本文详细分享了什么是智能体工程以及开发工程规范。智能体工程将非确定性大模型迭代为可靠生产级应用，它融合产品、工程与数据思维，强调放弃完美主义，在真实用户互动中持续成长，一定会是未来产品的最完美形态。

大模型真好玩
22天前
192
2
1

一文详解2026年技术圈最火概念——Agent Engineering智能体工程

LangChain DeepAgents 速通指南（四）—— FileSystem中间件：让AI Agent拥有系统级记忆管理能力

FileSystem中间件为Agent赋予文件管理能力，通过四种后端实现不同层级的记忆：线程级短期记忆、跨线程长期记忆、本地磁盘持久化和混合路由，从而灵活应对从临时草稿到长期记忆的存储需求。

大模型真好玩
26天前
314
4
评论

LangChain DeepAgents 速通指南（四）—— FileSystem中间件：让AI Agent拥有系统级记忆管理能力

大模型训练全流程实战指南工具篇（八）——EasyDataset问答数据集生成流程

本文以EasyDataset工具为例，系统介绍了问答对数据集的完整生成流程：从问题生成、答案生成，到采用“自动化初筛+人工抽检”策略进行质量评估，最后导出标准格式，为模型微调提供高质量数据。

大模型真好玩
29天前
134
1
评论

大模型训练全流程实战指南工具篇（八）——EasyDataset问答数据集生成流程

LangChain DeepAgents 速通指南（三）—— 让Agent告别混乱：Tool Selector与Todo List中间件解析

本期介绍ToolSelector与TodoList中间件：ToolSelector智能筛选相关工具；TodoList自动拆解子任务并维护状态，二者共同提升DeepAgents处理复杂任务的性能。

大模型真好玩
1月前
610
4
评论

LangChain DeepAgents 速通指南（三）—— 让Agent告别混乱：Tool Selector与Todo List中间件解析

大模型训练全流程实战指南工具篇（七）——EasyDataset文档处理流程

本篇以EasyDataset为例，系统讲解大模型预训练数据集的构建流程：从安装配置、文本分块（多种策略）、数据清洗到领域标签生成，最终导出预训练数据，为初学者提供从原始文档到高质量数据集的完整实践。

大模型真好玩
1月前
185
1
评论

大模型训练全流程实战指南工具篇（七）——EasyDataset文档处理流程

LangChain DeepAgents 速通指南（二）—— Summarization中间件为Agent作记忆加减法

本文深入讲解LangChain DeepAgents内置的Summarization中间件，它能自动压缩对话历史，解决大模型上下文窗口限制问题，为Agent记忆“做减法”，助力高效处理长任务。

大模型真好玩
1月前
386
2
评论

LangChain DeepAgents 速通指南（二）—— Summarization中间件为Agent作记忆加减法

个人成就

优秀创作者

文章被点赞 996

文章被阅读 198,243

掘力值 6,092

加入于

2021-08-15