首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
AI大模型技术星球
掘友等级
高级工程师
某大厂在职老牛,Ai大模型开发工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 8
沸点 0
赞
8
返回
|
搜索文章
AI大模型技术星球
关注了
聚客AI
高级工程师
AI大模型技术星球
高级工程师
·
23天前
关注
🚀重构LLM开发生态:无状态Reducer+小型Agent架构实战指南
为构建可靠、可维护且可扩展的 LLM 应用,避免一些非确定性 AI 组件带来的一些意图理解的偏差、上下文管理的混乱、人机协作的断层等问题,我将通过12-Factor Age...
0
评论
分享
AI大模型技术星球
高级工程师
·
1月前
关注
⚡深入解析 ReAct 代理模式:从原理到原生实现
一、ReAct 模式:AI 代理的“思考-行动”循环 ReAct(Reasoning + Action)是一种让大语言模型(LLM)自主完成任务的核心架构。与传统直接生成答...
0
评论
分享
AI大模型技术星球
高级工程师
·
1月前
关注
🔥【2025高频面试题】AI大模型岗位面试题之 Prompt 提示词工程
1. 什么是Prompt(提示词)?在AI大模型语境下,它的核心作用是什么? 答案: Prompt是用户提供给大语言模型(LLM)的输入文本或指令,用于引导和激发模型生成...
1
评论
分享
AI大模型技术星球
高级工程师
·
1月前
关注
⚡上下文工程:优化智能体性能的关键策略
智能体在执行长期任务时,上下文窗口(类似计算机的RAM)的容量有限,易导致性能下降、成本飙升或幻觉问题。上下文工程正是为解决这些问题而生。它通过精心筛选、存储和优化上下文信...
0
评论
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
2月前
关注
💡小白都能看懂的RAG分块实战:从递归分割到LLM智能拆解的全解析
在构建RAG(检索增强生成)系统时,文本分块质量直接影响知识检索精度与LLM输出效果。本文将深入解析五种分块策略的工程实现与优化方案。文中还会放一些技术文档,方便大家更好的...
4
评论
分享
AI大模型技术星球
高级工程师
·
2月前
关注
🚀解锁RAG精度:200-800 Token分块大小的黄金法则,别再犯这些错!
引言:分块——RAG系统的命脉 在RAG架构中,分块是连接原始文档和语义检索的桥梁。它决定了嵌入模型能否精准捕捉文本语义,以及LLM能否生成高质量回答。许多开发者误以为“越...
4
评论
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
2月前
关注
✅企业级AI集成方案:MCP服务端如何重构系统交互范式
一、MCP服务架构核心 三层服务模型(资源/提示/工具协同工作): 服务类型对比矩阵: 服务类型 状态修改 缓存支持 协议类比 典型应用场景 Resourc...
4
评论
分享
AI大模型技术星球
高级工程师
·
2月前
关注
✅2025全网最具权威深度解析并手写RAG Pipeline
为了帮助大家从底层更好地理解 RAG 的工作原理,带你撕开技术黑箱,仅用numpy等Python基础库构建RAG系统,从零手撕RAG内核!从文本划分、向量化、相似度检索到生...
5
1
分享
AI大模型技术星球
高级工程师
·
2月前
关注
🔥企业级必读:筛选高可用MCP服务的黄金标准
一、MCP vs Function Call:本质差异与协议优势 核心能力对比 协议层创新: 关键突破:通过context字段实现跨工具会话状态保持,解决复杂任务中的信息孤...
7
1
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
3月前
关注
📚LangChain与LlamaIndex深度整合:企业级树状数据RAG实战指南
本文首次公开结构化树状数据的RAG全链路优化方案,通过独创的路径感知混合嵌入算法和动态子树分块策略,成功在工业级场景中将召回率提升25-40%、延迟降低30-50%。我们将...
5
评论
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
3月前
关注
大模型学习进阶路线图:从Prompt到预训练的四阶段全景解析
在探讨大模型(LLM)的四阶段技术时,我们可以从Prompt Engineering(提示工程)、AI Agent(人工智能代理)、Fine-tuning(微调)以及Pre...
7
评论
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
3月前
关注
🚀拒绝试错成本!企业接入MCP协议的避坑清单
一、MCP Sampling:让大模型学会“精准提问” 1.1 采样原理拆解 核心作用:解决传统情感分析中“上下文缺失”和“动态场景适应”难题 关键优势: 人工审核机制:拦...
25
4
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
3月前
关注
从开发到上云:MCP架构全链路企业级落地指南 (完整生命周期覆盖)
一、MCP协议:大模型与外部系统的“神经枢纽” 核心价值 解耦设计:大模型(Client)专注推理决策,外部操作(Server)交给工具执行 动态扩展:新增工具无需修改模型...
12
评论
分享
AI大模型技术星球
高级工程师
·
3月前
关注
RAG三阶段避坑指南:解决召回不全/上下文冗余/事实错误
从理论到实践,全面解析RAG性能瓶颈与高阶优化方案。 一、RAG核心架构全景图 RAG性能瓶颈分析 二、检索阶段深度优化 1. 多路召回架构实现 2. 重排序优化(Cros...
1
评论
分享
AI大模型技术星球
高级工程师
·
3月前
关注
工业级Transformer优化手册:混合精度训练+量化部署实战解析
一、Transformer训练过程深度剖析 1.1 训练流程全景图 1.2 关键训练技术 1.2.1 教师强制(Teacher Forcing) 1.3 损失函数与优化策略...
3
评论
分享
AI大模型技术星球
赞了这篇文章
聚客AI
AI大模型应用开发工程师
·
3月前
关注
🛫AI大模型训练到发布一条龙:Hugging Face终极工作流
本文全面解析Hugging Face Transformers库的核心功能,通过丰富示例和最佳实践,带你快速掌握预训练模型的加载、使用和微调技术。...
6
评论
分享
AI大模型技术星球
高级工程师
·
3月前
关注
💻 工业级代码实战:TransformerEncoderLayer六层堆叠完整实现(附调试技巧)
一、Transformer编码器整体结构 Transformer编码器由N个相同层堆叠而成,单层结构包含: 二、核心技术解析与实现 1. 位置编码(Positional E...
1
评论
分享
AI大模型技术星球
高级工程师
·
3月前
关注
⚙️企业级Transformer优化:混合精度×梯度裁剪×权重初始化最佳实践
一、自注意力机制:Transformer的核心突破 核心思想:让每个位置都能关注序列中所有位置的信息 1.1 Query-Key-Value 抽象模型 QKV角色解析: Q...
1
评论
分享
AI大模型技术星球
高级工程师
·
3月前
关注
🔧 PyTorch高阶开发工具箱:自定义模块+损失函数+部署流水线完整实现
一、自定义神经网络层:释放模型设计潜能 核心原理:继承nn.Module并实现forward方法 1.1 实现带权重归一化的全连接层 1.2 实现可学习参数激活函数 自定义...
0
评论
分享
下一页
个人成就
文章被点赞
29
文章被阅读
24,463
掘力值
468
关注了
1
关注者
59
收藏集
0
关注标签
7
加入于
2025-06-10