提示词工程(Prompt)
Prompt起源于研究者们为了下游任务设计出来的一种输入形式,它的作用是能够帮助预训练模型“回忆”起自己在预训练时“学习”到的东西,因此又可以叫它提示词。而对于大语言模型来说,Prompt 就是用户的输入,它可以是一句简单的问题,一段较长的文本,也可以是一组指令,这取决于用户的具体需求。
用专业术语来说:在人工智能(AI)领域中,"prompt" 是指向模型提供输入以引导其生成特定输出的文本或指令。它是与模型进行交互时用户提供的文本段落,用于描述用户想要从模型获取的信息、回答、文本等内容。Prompt 的目的是引导模型产生所需的回应,以便更好地控制生成的输出。
Embedding和向量数据库
向量数据库与Elasticsearch(ES)的核心区别在于数据模型、索引技术和适用场景。以下是具体对比:
核心区别
-
数据模型
- 向量数据库:存储非结构化数据(如文本、图像、语音)的高维向量表示(如嵌入向量)。
- ES:处理结构化/半结构化数据(如JSON文档、文本字段)。
-
索引技术
- 向量数据库:使用近似最近邻算法(如HNSW、IVF)加速相似性搜索。
- ES:基于倒排索引(关键词分词)和BKD树(数值范围)。
-
查询方式
- 向量数据库:通过余弦相似度、欧氏距离等计算向量距离。
- ES:支持关键词匹配、布尔查询、聚合统计等。
适用场景
- 向量数据库:语义搜索、图像/视频检索、推荐系统。
- ES:日志分析、电商商品搜索、企业级全文检索。
性能特点
- 向量数据库:高并发、低延迟的相似性搜索(如推荐系统)。
- ES:实时分析、复杂查询(如日志过滤)。
检索增强生成(RAG)
检索增强生成(Retrieval-augmented Generation, RAG)是为生成式 AI 赋予信息检索能力的关键技术,通过将外部知识库的精准信息与大型语言模型(LLM)的推理能力结合,从根源上缓解 LLM 的固有缺陷。
Text2SQL
LangChain
FunctionCalling
Fine-tuning
多模态
智能体(Agent)
指能感知环境、自主决策并执行任务的智能系统,已从辅助工具进化为生产力主体。
Coze
Dify
Dify 提供安全数据通道、高可靠索引检索、友好提示词开发、多模型切换、推理观测、日志记录、数据标注、模型训练、微调、简化AI研发、定制化Agent自动化、AI工作流编排等优势,实现数据安全、开发高效、模型优化、自动化智能及工作流管理,助力开发者轻松构建灵活的AI应用。
模型上下文协议(MCP)与A2A协议
MCP,即 Model Context Protocol(模型上下文协议),由 Anthropic 公司(也就是开发 Claude 模型的公司)推出的一个开放标准协议。它如同智能交互领域的 “通用插头” 或 “USB 接口”,通过制定统一规范,实现 AI 模型与外部资源的无缝对接。无论是连接数据库、调用第三方 API,还是访问本地文件,MCP 都能有效解决 AI 模型与外部数据源、工具间的交互难题,为 AI 应用拓展了更广阔的可能性。