首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
聚客AI
掘友等级
AI大模型应用开发工程师
致力于推动人工智能的发展,打造AI人专属的学习交流平台。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
最新
热门
🔷告别天价算力!2025性价比最高的LLM私有化训练路径
在对大语言模型(LLM)进行微调时,有多种技术可选。今天我们分享一下最值得关注的 4 款工具 —— 从单卡 到支持万亿参数的分布式集群,它们几乎覆盖了所有 LLM 微调场景,让我们看看该在什么时候用哪
🎯2025架构革命:图解MCP工具链×MoE推理优化×多智能体协同
最近看到很多人对MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 都分不清楚,今天我将通过图文,为你讲解其核心技术与实践原理,希望对你们有所帮助。 一、大
🚀碾压传统方案!vLLM与TGI/TensorRT-LLM性能实测对比
随着大语言模型(LLM)在生成式AI产业中广泛应用,如何高效、经济地部署和推理这些庞大的模型,成为每一位开发者和企业面临的核心挑战。尤其是在构建真实的在线AI应用时,性能瓶颈、资源浪费、高昂费用等问题
👉FastMCP深度解析:ctx.sample() 如何实现LLM任务逆向委托
在现代大语言模型(LLM)应用架构中,Model-Client-Protocol (MCP) 设计模式因其清晰的职责分离(服务器暴露工具、数据和提示,客户端使用 LLM 调用)而广受欢迎。然而,一个关
🔥从零构建可靠AI智能体:CAP框架的分层实现与避坑策略
前言:全维度智能体提示词框架(Comprehensive Agent Prompting Framework,简称CAP) 为AI 智能体创造了一个从"我是谁"到"我能做什么"再到"我不能做什么",以
💡大模型智能体应用评估揭秘:指标、框架与落地实践
随着企业级LLM应用复杂度提升,构建科学评估体系成为工程落地核心瓶颈。今天我将系统拆解多轮对话、RAG、智能体三类场景的评估方案,并对比主流框架的工程适配性,希望对各位有所帮助。 一、评估范式演进:从
🔥MoE技术大揭秘:混合专家模型如何重塑AI大模型?
近年来,混合专家模型(Mixture of Experts, MoE)技术在大模型领域迅速崛起,成为解决计算效率和扩展性问题的关键创新。我将从核心原理、显著优势、落地应用以及当前挑战四个方面,全面解析
📰多智能体才是未来:深度解析多Agent架构带你从零到生产级部署
前言:“ISC.AI 2025互联网安全大会开幕式及未来峰会”于8月6日在北京举行。360集团创始人、ISC大会主席周鸿祎在演讲中表示,行业里还有很多的争论,到底是做单智能体还是多智能体。多智能体这个
💡小白都能看懂的RAG分块实战:从递归分割到LLM智能拆解的全解析
在构建RAG(检索增强生成)系统时,文本分块质量直接影响知识检索精度与LLM输出效果。本文将深入解析五种分块策略的工程实现与优化方案。文中还会放一些技术文档,方便大家更好的理解RAG中常见的技术点。
✅掌握ReAct=掌控AI代理灵魂:从工具调用、循环架构到生产级优化
一、ReAct 模式:AI 代理的“思考-行动”循环 ReAct(Reasoning + Action)是一种让大语言模型(LLM)自主完成任务的核心架构。与传统直接生
下一页
个人成就
优秀创作者
文章被点赞
506
文章被阅读
298,190
掘力值
5,702
关注了
0
关注者
479
收藏集
0
关注标签
7
加入于
2022-03-04