首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大模型真好玩
掘友等级
人工智能大模型
|
alibaba
公众号:大模型真好玩。北京理工大学本硕,曾就职于字节阿里,目前在某大型国企研究大模型。分享最简洁最实用的人工智能大模型开发经验,看好未来世界人工智能大模型会和PC一样成为人手必备的工具!
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
158
文章 154
沸点 4
赞
158
返回
|
搜索文章
赞
文章( 154 )
沸点( 4 )
大模型训练全流程实战指南工具篇(十)—— 小白也能懂的大模型训练参数万字详解
本文系统讲解LLaMAFactory的核心参数,涵盖全量训练、LoRA 对比、参数含义与调优、适配器合并导出,通过形象比喻帮助大家真正掌握大模型训练,从“能跑通”迈向“效果好、更可控”。
失业9个月,我成了公司老板:这并非运气,而是蓄谋已久
这不是一篇爽文,而是一个普通程序员在职业寒冬里的自救指南。 如果你正处于焦虑中,或者也在寻找第二曲线,希望我的这段经历,能治愈你的精神内耗,带给你一点光。
LangChain DeepAgents 速通指南(五)—— 快速了解DeepAgents框架及其核心特性
本文分享了DeepAgents框架的诞生背景与核心优势,并演示了其快速上手的完整流程。DeepAgents 在任务规划、上下文管理、子代理并行执行等方面展现出强大的能力,仅需少量代码即可构建复杂智能体
大模型训练全流程实战指南工具篇(九)——LLamaFactory大模型训练工具使用指南
本期分享以LLaMAFactory大模型训练框架 为例,从环境搭建到模型下载、数据准备、微调训练、权重合并及部署测试,完整演示了 大模型训练的实战流程,充分展现了训练框架的极简操作和核心优势。
一文详解2026年技术圈最火概念——Agent Engineering智能体工程
本文详细分享了什么是智能体工程以及开发工程规范。智能体工程将非确定性大模型迭代为可靠生产级应用,它融合产品、工程与数据思维,强调放弃完美主义,在真实用户互动中持续成长,一定会是未来产品的最完美形态。
LangChain DeepAgents 速通指南(四)—— FileSystem中间件:让AI Agent拥有系统级记忆管理能力
FileSystem中间件为Agent赋予文件管理能力,通过四种后端实现不同层级的记忆:线程级短期记忆、跨线程长期记忆、本地磁盘持久化和 混合路由,从而灵活应对从临时草稿到长期记忆的存储需求。
大模型训练全流程实战指南工具篇(八)——EasyDataset问答数据集生成流程
本文以EasyDataset工具为例,系统介绍了问答对数据集的完整生成流程:从问题生成、答案生成,到采用“自动化初筛+人工抽检”策略进行质量评估,最后导出标准格式,为模型微调提供高质量数据。
LangChain DeepAgents 速通指南(三)—— 让Agent告别混乱:Tool Selector与Todo List中间件解析
本期介绍ToolSelector与TodoList中间件:ToolSelector智能筛选相关工具;TodoList自动拆解子任务并维护状态,二者共同提升DeepAgents处理复杂任务的性能。
大模型训练全流程实战指南工具篇(七)——EasyDataset文档处理流程
本篇以EasyDataset为例,系统讲解大模型预训练数据集的构建流程:从安装配置、文本分块(多种策略)、数据清洗到领域标签生成,最终导出预训练数据,为初学者提供从原始文档到高质量数据集的完整实践。
LangChain DeepAgents 速通指南(二)—— Summarization中间件为Agent作记忆加减法
本文深入讲解LangChain DeepAgents内置的Summarization中间件,它能自动压缩对话历史,解决大模型上下文窗口限制问题,为Agent记忆“做减法”,助力高效处理长任务。
下一页
个人成就
优秀创作者
文章被点赞
996
文章被阅读
198,243
掘力值
6,092
关注了
34
关注者
1,117
收藏集
29
关注标签
0
加入于
2021-08-15