首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大模型真好玩
掘友等级
人工智能大模型
|
alibaba
公众号:大模型真好玩。北京理工大学本硕,曾就职于字节阿里,目前在某大型国企研究大模型。分享最简洁最实用的人工智能大模型开发经验,看好未来世界人工智能大模型会和PC一样成为人手必备的工具!
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
155
文章 151
沸点 4
赞
155
返回
|
搜索文章
最新
热门
大模型训练全流程实战指南工具篇(九)——LLamaFactory大模型训练工具使用指南
本期分享以LLaMAFactory大模型训练框架 为例,从环境搭建到模型下载、数据准备、微调训练、权重合并及部署测试,完整演示了 大模型训练的实战流程,充分展现了训练框架的极简操作和核心优势。
一文详解2026年技术圈最火概念——Agent Engineering智能体工程
本文详细分享了什么是智能体工程以及开发工程规范。智能体工程将非确定性大模型迭代为可靠生产级应用,它融合产品、工程与数据思维,强调放弃完美主义,在真实用户互动中持续成长,一定会是未来产品的最完美形态。
LangChain DeepAgents 速通指南(四)—— FileSystem中间件:让AI Agent拥有系统级记忆管理能力
FileSystem中间件为Agent赋予文件管理能力,通过四种后端实现不同层级的记忆:线程级短期记忆、跨线程长期记忆、本地磁盘持久化和 混合路由,从而灵活应对从临时草稿到长期记忆的存储需求。
大模型训练全流程实战指南工具篇(八)——EasyDataset问答数据集生成流程
本文以EasyDataset工具为例,系统介绍了问答对数据集的完整生成流程:从问题生成、答案生成,到采用“自动化初筛+人工抽检”策略进行质量评估,最后导出标准格式,为模型微调提供高质量数据。
LangChain DeepAgents 速通指南(三)—— 让Agent告别混乱:Tool Selector与Todo List中间件解析
本期介绍ToolSelector与TodoList中间件:ToolSelector智能筛选相关工具;TodoList自动拆解子任务并维护状态,二者共同提升DeepAgents处理复杂任务的性能。
大模型训练全流程实战指南工具篇(七)——EasyDataset文档处理流程
本篇以EasyDataset为例,系统讲解大模型预训练数据集的构建流程:从安装配置、文本分块(多种策略)、数据清洗到领域标签生成,最终导出预训练数据,为初学者提供从原始文档到高质量数据集的完整实践。
LangChain DeepAgents 速通指南(二)—— Summarization中间件为Agent作记忆加减法
本文深入讲解LangChain DeepAgents内置的Summarization中间件,它能自动压缩对话历史,解决大模型上下文窗口限制问题,为Agent记忆“做减法”,助力高效处理长任务。
LangChain DeepAgents 速通指南(一)—— 一文详解DeepAgents核心特性
DeepAgents是LangChain团队开发的框架,封装任务规划、子代理管理、文件系统等通用能力,通过create_deep_agent函数让开发者仅需数行代码即可构建复杂智能体,实现搭积木式开发
最强开源多模态大模型它来啦——一文详解Qwen3.5核心特性
Qwen3.5-397B-A17B是全球最强原生多模态模型,支持图像/视频输入,对话、编程、Agent构建等能力追平GPT-5.2。采用极致稀疏MoE架构,性能超越Qwen3-Max,显存降低60%。
大模型训练全流程实战指南工具篇(六)——OCR工具实战指南(以DeepSeek-OCR-2为例)
本文以DeepSeek-OCR-2为例,详解其核心特性、本地部署及推理实战。并延伸后处理策略,涵盖数据清洗、RAG优化到多模态检索,打通从“读出来”到“用起来”的全链路,为高质量数据集构建提供实战指南
下一页
个人成就
优秀创作者
文章被点赞
970
文章被阅读
186,158
掘力值
5,921
关注了
34
关注者
1,059
收藏集
29
关注标签
0
加入于
2021-08-15