首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
聚客AI
掘友等级
AI大模型应用开发工程师
致力于推动人工智能的发展,打造AI人专属的学习交流平台。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4
文章 4
沸点 0
赞
4
返回
|
搜索文章
最新
热门
🎉7.6倍训练加速与24倍吞吐提升:两项核心技术背后的大模型推理优化全景图
在大语言模型(LLM)的推理过程中,Attention机制是计算和内存消耗的主要瓶颈。FlashAttention和PagedAttention作为两项革命性优化技术,分别从计算效率和内存管理两个维度
🙋♀️Transformer训练与推理全流程:从输入处理到输出生成
在人工智能领域,Transformer架构无疑是大模型发展史上最重要的里程碑之一。它不仅构成了当前大模型处理任务的基础架构,更是深入理解现代大模型系统的关键。今天我将通过结合论文原理与PyTorch源
🌟大模型为什么产生幻觉?预训练到推理的漏洞全揭秘
随着大模型迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。所谓模型幻觉,指的是模型在生成内容时产生与事实不符、虚构或误导性的信息。因此,如何识别、抑制甚至消除幻
🚫万能Agent兜底:当规划缺失工具时,AI如何自救
在多智能体协作调度场景中,尽管存在诸如层级指挥、嵌套模式、转交模式和群聊模式等多种实现方式,但层级指挥模式仍是生产环境中最常用的方式。该模式通常由主代理生成任务拆分,调度工具或子智能体分别执行,类似
🍬传统工程师转型:智能体架构师的技能图谱
随着大语言模型(LLM)的 AI 智能体正在快速发展,逐渐超越传统对话式 LLM 的能力边界。这些智能体的强大功能依赖于多个组件的协同工作。今天我将带大家深入探索 AI 智能体的架构设计、关键技术及核
⚠️Embedding选型指南:五步搞定数据规模、延迟与精度平衡!
在实际应用项目开发中,如何高效、精准地处理文本检索和相似性匹配已成为关键问题。不同的嵌入(Embedding)技术有各自的优缺点和适用场景,正确选型能够显著提升系统性能与效果。 今天我将系统解析七种主
🚀从零构建AI智能体:九大核心技术拆解与落地建议
今天我们来系统梳理AI智能体架构设计的九大核心技术,这些技术构成了现代AI应用开发的核心框架,涵盖从基础推理到多智能体协作、从数据处理到人机交互的关键层面。欢迎各位指正交流。 一、AI 智能体(AI
🌈多感官AI革命:解密多模态对齐与融合的底层逻辑
多模态学习模拟人类认知过程——例如描述电影时,我们不会孤立地评价画面或音乐,而是综合视觉、听觉和剧情信息形成整体感受。但是,这要求模型从单模态处理(如仅分析图像或文本)进化到多模态协同,能同时理解和关
🌸万字解析:大规模语言模型(LLM)推理中的Prefill与Decode分离方案
在LLM推理计算中Prefill和Decode两个阶段的计算/显存/带宽需求不一样,通常Prefill是算力密集,Decode是访存密集。一些场景中P和D两者分开计算可提升性能。vLLM是一种主流的推
⭐精准率暴跌50%?RAG开发者必避的十大认知误区
在RAG(检索增强生成)系统开发中,技术选型与场景适配的合理性直接决定系统性能。今天我将基于企业级实践经验,系统化拆解开发全流程的十大关键误区,并提供四维优化框架,助力开发者构建高精度、高可用的R
下一页
个人成就
文章被点赞
465
文章被阅读
269,978
掘力值
5,445
关注了
0
关注者
454
收藏集
0
关注标签
7
加入于
2022-03-04