首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
聚客AI
掘友等级
AI大模型应用开发工程师
致力于推动人工智能的发展,打造AI人专属的学习交流平台。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 3
沸点 0
赞
3
返回
|
搜索文章
聚客AI
AI大模型应用开发工程师
·
9小时前
关注
👀10分钟搞懂RAG架构:离线索引+在线检索的闭环秘密
RAG的检索增强生成(Retrieval-Augmented Generation, RAG)技术,一直是不少人研究和优化的方向,RAG通过整合外部知识库来增强模型能力,特...
0
评论
分享
聚客AI
AI大模型应用开发工程师
·
1天前
关注
💥下一代推理引擎:vLLM如何重塑AI服务架构?
作为分布式大模型推理引擎,vLLM通过分页注意力、连续批处理等核心技术实现高吞吐与低延迟。今天我将深度解析其架构设计。如果对你有所帮助,记得告诉身边有需要的朋友。 一、...
0
评论
分享
聚客AI
AI大模型应用开发工程师
·
2天前
关注
✅5大实战技巧:优化RAG召回质量,避免“召回不足”灾难!
在垂直行业(金融风控)系统的开发中,我们团队曾因RAG召回文档不准确导致合规报告生成错误。这个惨痛教训让我们意识到:把RAG跑通只需要三天,但让召回精准却需要三个月...
0
评论
分享
聚客AI
AI大模型应用开发工程师
·
3天前
关注
🤖告别复杂粘合代码:LangGraph+OceanBase构建智能Agent蓝图
不知道你们有没有遇到过,在我们一些实际落地的AI项目中,虽然前期“Demo 很惊艳,但上线后却无人问津”。你们有没有想过问题究竟在哪?今天我将从企业级 AI 应用的真实场景...
1
评论
分享
聚客AI
AI大模型应用开发工程师
·
4天前
关注
⚡从单机到分布式:双MCP服务器负载架构详解
LangGraph 被广泛认为是构建生产级代理系统的首选。今天我们将通过深度研究助手这个示例,深入探讨 LangGraph 的工作流程和 MCP 的集成模式。如果对你有所帮...
3
评论
分享
聚客AI
AI大模型应用开发工程师
·
5天前
关注
🤯RAG系统升级:微调嵌入模型提升上下文检索质量
我们都知道文本嵌入模型能将文本表示为具有语义意义的向量,广泛应用于检索、分类、检索增强生成(RAG)等场景。然而,通用嵌入模型在特定领域任务上往往表现不佳,语义相似度不足以...
3
评论
分享
聚客AI
AI大模型应用开发工程师
·
7天前
关注
💡突破RAG性能瓶颈:揭秘查询转换与智能路由黑科技
大多数团队在构建RAG系统时,会经历多轮实验,依赖多个组件如查询转换、智能路由、索引策略等。每个组件都需要独立的设置和调优,稍有不慎就会影响整体性能。今天我将深度解析从基础...
5
评论
分享
聚客AI
AI大模型应用开发工程师
·
8天前
关注
💡为什么你的RAG回答总是胡言乱语?致命瓶颈在数据预处理层
不知道大家在RAG项目实践中,有没有遇到这个问题?用LangChain框架自带的PyPDFLoader加载PDF报告时,虽然流程跑通了,但给出的结果回答质量极低,各种回避问...
1
评论
分享
聚客AI
AI大模型应用开发工程师
·
9天前
关注
❗️智能体工作流(Agentic Workflow):AI应用开发的全面解析
随着基座模型的不断更新成熟,智能体工作流(Agentic Workflow)已成为AI领域的热点,它将AI智能体(AI Agent)的推理能力与结构化工作流结合,实现复杂任...
3
评论
分享
聚客AI
AI大模型应用开发工程师
·
10天前
关注
💬深入解析:向量数据库如何为LLMs添加长期记忆
在大语言模型、生成式AI和语义搜索等应用,我们都知道会依赖于向量嵌入(vector embeddings)来捕捉语义信息,实现长期记忆和实时推理。但传统标量数据库无法胜任这...
3
评论
分享
聚客AI
AI大模型应用开发工程师
·
11天前
关注
🔥如何选择AI代理协议:MCP、A2A、ACP、ANP实战选型手册
随着Agentic AI协议的演进,AI系统正从单体模型向多代理协作生态转型。今天我将深度解析四大核心协议的技术特性与应用场景,希望能帮助到各位。 一、Agentic AI...
6
评论
分享
聚客AI
AI大模型应用开发工程师
·
12天前
关注
📈超越Prompt Engineering:揭秘高并发AI系统的上下文工程实践
随着AI应用从单次交互转向复杂智能体系统,传统Prompt Engineering(提示工程)的局限性日益凸显。今天我将系统阐述AI工程范式的演进路径,深入剖析Contex...
4
评论
分享
聚客AI
AI大模型应用开发工程师
·
14天前
关注
📚LangChain框架下的检索增强:5步构建高效智能体系统
检索增强智能体技术正在重塑AI应用的开发范式,它巧妙地将大语言模型的推理能力与结构化知识检索相结合,解决了传统智能体在处理动态信息时的局限性。今天我将根据实际开发中的痛点:...
2
评论
分享
聚客AI
AI大模型应用开发工程师
·
15天前
关注
🧠深度解析模型压缩革命:减枝、量化、知识蒸馏
本文系统拆解深度学习中模型剪枝、量化、知识蒸馏三大核心压缩技术,帮助各位实现16倍模型压缩与4倍推理加速。如果对你有所帮助,记得点个小红心。 一、模型压缩的核心挑战...
2
评论
分享
聚客AI
AI大模型应用开发工程师
·
16天前
关注
🧩万亿级Token训练!解密大模型预训练算力黑洞与RLHF对齐革命
人工智能大模型(如GPT、LLaMA等)已成为推动AI产业变革的核心引擎。其价值在于通过海量数据预训练提取通用知识,大幅提升模型泛化能力,降低微调成本。然而,大模型的开发涉...
2
评论
分享
聚客AI
AI大模型应用开发工程师
·
17天前
关注
📝工程级开源:PyTorch手搓LLaMA4-MoE全栈指南
近年来,大语言模型在自然语言处理领域不断演进,从GPT系列到LLaMA,持续推动模型规模与推理性能的提升。其中,专家混合(Mixture of Experts, MoE)技...
1
评论
分享
聚客AI
AI大模型应用开发工程师
·
18天前
关注
✅响应时间从8秒到3秒:AI知识库性能优化避坑指南
在各行业中,AI知识库已成为提升效率的核心工具。今天我将通过企业实际落地案例,详解从架构设计到性能优化的全流程技术方案,助你避开共性陷阱。希望对你有所帮助,记得点个小红心,...
3
评论
分享
聚客AI
AI大模型应用开发工程师
·
19天前
关注
🔷告别天价算力!2025性价比最高的LLM私有化训练路径
在对大语言模型(LLM)进行微调时,有多种技术可选。今天我们分享一下最值得关注的 4 款工具 —— 从单卡 到支持万亿参数的分布式集群,它们几乎覆盖了所有 LLM 微调场景...
3
评论
分享
聚客AI
AI大模型应用开发工程师
·
21天前
关注
🎯2025架构革命:图解MCP工具链×MoE推理优化×多智能体协同
最近看到很多人对MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 都分不清楚,今天我将通过图文,为你讲解其核心技术与实践原理,...
4
评论
分享
聚客AI
AI大模型应用开发工程师
·
22天前
关注
🚀碾压传统方案!vLLM与TGI/TensorRT-LLM性能实测对比
随着大语言模型(LLM)在生成式AI产业中广泛应用,如何高效、经济地部署和推理这些庞大的模型,成为每一位开发者和企业面临的核心挑战。尤其是在构建真实的在线AI应用时,性能瓶...
1
评论
分享
下一页
个人成就
文章被点赞
280
文章被阅读
202,583
掘力值
4,177
关注了
0
关注者
298
收藏集
0
关注标签
7
加入于
2022-03-04