首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
听风者就是我
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
(LLM系列)RAG系统性能优化实战:从评估不达标到全面通关的完整历程
本实战通过阿里云百炼与pgvector构建RAG系统,并利用Ragas框架进行专业评估。针对初期4项指标不达标,实施了创建LLM-as-a-Judge评估器、修复Rerank API、精调配置参数及模
LangChain 核心概念解析
LangChain 是由 Harrison Chase 于2022年10月发起的开源LLM应用开发框架,比ChatGPT问世还要早一个月。
混合检索:关键词 + 向量的最佳组合
在RAG系统中,没有哪一种检索方式是万能的。本文从原理出发,结合LangChain工程实践,深入拆解混合检索的架构设计与场景调参,带你找到关键词与向量的黄金配比。
(LLM系列)文档切分策略详解:Chunk Size 如何决定 RAG 系统的检索天花板
Chunk Size 是 RAG 系统中最被低估的核心超参数。本文系统对比固定切分、递归字符、结构感知、语义切分四种算法,深度解析 Overlap 策略原理,附场景调优配置与选型决策表,助你构建高召回
(LLM系列)Embedding模型详解:OpenAI/Cohere/BGE三大方案对比
在AI应用开发中,Embedding模型是连接自然语言和机器理解的关键桥梁。本文深入解析OpenAI、Cohere、BGE三大主流Embedding方案的技术原理、性能特点、应用场景,并提供详细的选型
向量数据库选型指南:Pinecone vs Weaviate vs Chroma 深度对比
向量数据库是AI应用的核心基础设施。本文深度对比Pinecone、Weaviate、Chroma三款主流方案,从性能、功能、成本、部署等维度分析,并提供实际场景选型建议,帮助开发者快速做出明智决策。
RAG(检索增强生成)原理与实践
引言 在大语言模型(LLM)蓬勃发展的今天,如何让AI更准确地回答特定领域的问题成为了一个关键挑战。RAG(Retrieval-Augmented Generation,检索增强生成)技术应运而生。
(LLM系列)让大模型“深思熟虑”:ReAct、Self-Consistency 与 Tree-of-Thought 全解析
在当今大语言模型快速发展的时代,推理能力已成为决定模型表现的关键因素。然而,许多开发者和用户可能没有意识到,通过精心设计的提示词技术,可以显著提升模型在复杂推理任务中的表现。
(LLM系列)Prompt工程完全指南:从零到高手
在人工智能快速发展的今天,掌握Prompt工程已成为有效使用大语言模型的关键技能。本文将深入探讨两个最重要的Prompt技术:Few-shot Learning和Chain-of-Thought
流式输出(Streaming)实现:提升用户体验
在现代 Web 应用中,用户体验的关键在于响应速度和交互反馈。当处理耗时操作时,传统的"等待-返回"模式往往让用户感到焦虑。流式输出(Streaming)技术通过逐步返回数据,让用户实时看到处理进度,
下一页
个人成就
文章被阅读
6,500
掘力值
335
关注了
9
关注者
1
收藏集
5
关注标签
60
加入于
2017-07-06