首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
大模型真好玩
掘友等级
人工智能大模型
|
alibaba
公众号:大模型真好玩。北京理工大学本硕,曾就职于字节阿里,目前在某大型国企研究大模型。分享最简洁最实用的人工智能大模型开发经验,看好未来世界人工智能大模型会和PC一样成为人手必备的工具!
获得徽章 1
动态
文章
专栏
沸点
收藏集
关注
作品
赞
147
文章 145
沸点 2
赞
147
返回
|
搜索文章
最新
热门
大模型训练全流程实战指南工具篇(七)——EasyDataset文档处理流程
本篇以EasyDataset为例,系统讲解大模型预训练数据集的构建流程:从安装配置、文本分块(多种策略)、数据清洗到领域标签生成,最终导出预训练数据,为初学者提供从原始文档到高质量数据集的完整实践。
LangChain DeepAgents 速通指南(二)—— Summarization中间件为Agent作记忆加减法
本文深入讲解LangChain DeepAgents内置的Summarization中间件,它能自动压缩对话历史,解决大模型上下文窗口限制问题,为Agent记忆“做减法”,助力高效处理长任务。
LangChain DeepAgents 速通指南(一)—— 一文详解DeepAgents核心特性
DeepAgents是LangChain团队开发的框架,封装任务规划、子代理管理、文件系统等通用能力,通过create_deep_agent函数让开发者仅需数行代码即可构建复杂智能体,实现搭积木式开发
最强开源多模态大模型它来啦——一文详解Qwen3.5核心特性
Qwen3.5-397B-A17B是全球最强原生多模态模型,支持图像/视频输入,对话、编程、Agent构建等能力追平GPT-5.2。采用极致稀疏MoE架构,性能超越Qwen3-Max,显存降低60%。
大模型训练全流程实战指南工具篇(六)——OCR工具实战指南(以DeepSeek-OCR-2为例)
本文以DeepSeek-OCR-2为例,详解其核心特性、本地部署及推理实战。并延伸后处理策略,涵盖数据清洗、RAG优化到多模态检索,打通从“读出来”到“用起来”的全链路,为高质量数据集构建提供实战指南
LangChain不支持AgentSkills?那就从0到1实现一个!
针对智能体工具过多导致性能下降的问题设计了一种仿ClaudeSkills的解决方案,通过双层工具架构、状态驱动与中间件拦截机制,实现工具的按需动态加载,显著降低Token消耗并提升模型调用工具的准确性
中美大模型“内战”都怎么打!一文详解Claude Opus 4.6和GPT-5.3 CodeX核心特性
本文聚焦AI领域巅峰对决,解析Claude 4.6 Opus与GPT-5.3 CodeX的核心特性:前者凭借超长上下文与强大Agent团队领衔复杂工作流;后者以精准意图理解与更高基准分数实现高效执行。
一文读懂OpenClaw核心特性与原理解析(文末附国产大模型+聊天软件接入OpenClaw视频教程地址)
本文分享了OpenClaw核心特性与设计原理,并提供接入国产大模型与聊天工具的实用指南。OpenClaw通过独特的网关系统,四层记忆架构、并借助Agent Skills体系灵活扩展向着未来数字员工迈进
大模型训练全流程实战指南工具篇(五)——大模型训练全流程步骤详解与对应工具推荐
本篇系统分享了大模型训练数据、训练、评测三大核心阶段,为每个环节推荐了如EasyDataset、LLaMAFactory、EvalScope等关键实用工具,旨在帮助读者构建清晰的大模型训练路径。
Agent Skills完全指南:核心概念丨设计模式丨实战代码
本篇分享了Agent Skills的核心概念、设计模式。并以Claude Code为例,通过代码实战详细演示了Skills的创建、使用及进阶集成方法,帮助大家快速掌握AgentSkills的开发技巧。
下一页
个人成就
优秀创作者
文章被点赞
912
文章被阅读
168,361
掘力值
5,622
关注了
32
关注者
965
收藏集
29
关注标签
0
加入于
2021-08-15