聚客AI

AI大模型应用开发工程师

致力于推动人工智能的发展，打造AI人专属的学习交流平台。

赞

4

|

搜索文章

🔷告别天价算力！2025性价比最高的LLM私有化训练路径

在对大语言模型（LLM）进行微调时，有多种技术可选。今天我们分享一下最值得关注的 4 款工具 —— 从单卡到支持万亿参数的分布式集群，它们几乎覆盖了所有 LLM 微调场景，让我们看看该在什么时候用哪

7月前
2.1k
4
评论

🔷告别天价算力！2025性价比最高的LLM私有化训练路径

🎯2025架构革命：图解MCP工具链×MoE推理优化×多智能体协同

最近看到很多人对MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 都分不清楚，今天我将通过图文，为你讲解其核心技术与实践原理，希望对你们有所帮助。一、大

7月前
2.1k
5
评论

🎯2025架构革命：图解MCP工具链×MoE推理优化×多智能体协同

🚀碾压传统方案！vLLM与TGI/TensorRT-LLM性能实测对比

随着大语言模型（LLM）在生成式AI产业中广泛应用，如何高效、经济地部署和推理这些庞大的模型，成为每一位开发者和企业面临的核心挑战。尤其是在构建真实的在线AI应用时，性能瓶颈、资源浪费、高昂费用等问题

7月前
481
3
评论

🚀碾压传统方案！vLLM与TGI/TensorRT-LLM性能实测对比

👉FastMCP深度解析：ctx.sample() 如何实现LLM任务逆向委托

在现代大语言模型（LLM）应用架构中，Model-Client-Protocol (MCP) 设计模式因其清晰的职责分离（服务器暴露工具、数据和提示，客户端使用 LLM 调用）而广受欢迎。然而，一个关

7月前
2.3k
2
3

👉FastMCP深度解析：ctx.sample() 如何实现LLM任务逆向委托

🔥从零构建可靠AI智能体：CAP框架的分层实现与避坑策略

前言：全维度智能体提示词框架(Comprehensive Agent Prompting Framework，简称CAP) 为AI 智能体创造了一个从"我是谁"到"我能做什么"再到"我不能做什么"，以

7月前
2.3k
1
评论

🔥从零构建可靠AI智能体：CAP框架的分层实现与避坑策略

💡大模型智能体应用评估揭秘：指标、框架与落地实践

随着企业级LLM应用复杂度提升，构建科学评估体系成为工程落地核心瓶颈。今天我将系统拆解多轮对话、RAG、智能体三类场景的评估方案，并对比主流框架的工程适配性，希望对各位有所帮助。一、评估范式演进：从

7月前
2.5k
6
评论

💡大模型智能体应用评估揭秘：指标、框架与落地实践

🔥MoE技术大揭秘：混合专家模型如何重塑AI大模型？

近年来，混合专家模型（Mixture of Experts, MoE）技术在大模型领域迅速崛起，成为解决计算效率和扩展性问题的关键创新。我将从核心原理、显著优势、落地应用以及当前挑战四个方面，全面解析

7月前
703
点赞
评论

🔥MoE技术大揭秘：混合专家模型如何重塑AI大模型？

📰多智能体才是未来：深度解析多Agent架构带你从零到生产级部署

前言：“ISC.AI 2025互联网安全大会开幕式及未来峰会”于8月6日在北京举行。360集团创始人、ISC大会主席周鸿祎在演讲中表示，行业里还有很多的争论，到底是做单智能体还是多智能体。多智能体这个

7月前
1.8k
2
1

📰多智能体才是未来：深度解析多Agent架构带你从零到生产级部署

💡小白都能看懂的RAG分块实战：从递归分割到LLM智能拆解的全解析

在构建RAG（检索增强生成）系统时，文本分块质量直接影响知识检索精度与LLM输出效果。本文将深入解析五种分块策略的工程实现与优化方案。文中还会放一些技术文档，方便大家更好的理解RAG中常见的技术点。

7月前
2.2k
7
评论

💡小白都能看懂的RAG分块实战：从递归分割到LLM智能拆解的全解析

✅掌握ReAct=掌控AI代理灵魂：从工具调用、循环架构到生产级优化

一、ReAct 模式：AI 代理的“思考-行动”循环 ReAct（Reasoning + Action）是一种让大语言模型（LLM）自主完成任务的核心架构。与传统直接生

7月前
1.7k
2
评论

✅掌握ReAct=掌控AI代理灵魂：从工具调用、循环架构到生产级优化

个人成就

优秀创作者

文章被点赞 506

文章被阅读 298,190

掘力值 5,702

加入于

2022-03-04