AI全栈索引

32 阅读3分钟

提示词工程(Prompt)

Prompt起源于研究者们为了下游任务设计出来的一种输入形式,它的作用是能够帮助预训练模型“回忆”起自己在预训练时“学习”到的东西,因此又可以叫它提示词。而对于大语言模型来说,Prompt 就是用户的输入,它可以是一句简单的问题,一段较长的文本,也可以是一组指令,这取决于用户的具体需求。

用专业术语来说:在人工智能(AI)领域中,"prompt" 是指向模型提供输入以引导其生成特定输出的文本或指令。它是与模型进行交互时用户提供的文本段落,用于描述用户想要从模型获取的信息、回答、文本等内容。Prompt 的目的是引导模型产生所需的回应,以便更好地控制生成的输出。

Embedding和向量数据库

向量数据库与Elasticsearch(ES)的核心区别在于数据模型、索引技术和适用场景‌。以下是具体对比:

核心区别

  • 数据模型

    • 向量数据库:存储非结构化数据(如文本、图像、语音)的高维向量表示(如嵌入向量)。 ‌
    • ES:处理结构化/半结构化数据(如JSON文档、文本字段)。 ‌
  • 索引技术

    • 向量数据库:使用近似最近邻算法(如HNSW、IVF)加速相似性搜索。 ‌
    • ES:基于倒排索引(关键词分词)和BKD树(数值范围)。 ‌
  • 查询方式

    • 向量数据库:通过余弦相似度、欧氏距离等计算向量距离。 ‌
    • ES:支持关键词匹配、布尔查询、聚合统计等。 ‌

适用场景

  • 向量数据库:语义搜索、图像/视频检索、推荐系统。 ‌
  • ES:日志分析、电商商品搜索、企业级全文检索。 ‌

性能特点

  • 向量数据库:高并发、低延迟的相似性搜索(如推荐系统)。 ‌
  • ES:实时分析、复杂查询(如日志过滤)。

检索增强生成(RAG)

检索增强生成(Retrieval-augmented Generation, RAG)是为生成式 AI 赋予信息检索能力的关键技术,通过将外部知识库的精准信息与大型语言模型(LLM)的推理能力结合,从根源上缓解 LLM 的固有缺陷。

Text2SQL

LangChain

FunctionCalling

Fine-tuning

多模态

智能体(Agent)

指能感知环境、自主决策并执行任务的智能系统,已从辅助工具进化为生产力主体。‌‌

Coze

Dify

Dify 提供安全数据通道、高可靠索引检索、友好提示词开发、多模型切换、推理观测、日志记录、数据标注、模型训练、微调、简化AI研发、定制化Agent自动化、AI工作流编排等优势,实现数据安全、开发高效、模型优化、自动化智能及工作流管理,助力开发者轻松构建灵活的AI应用。

模型上下文协议(MCP)与A2A协议

MCP,即 Model Context Protocol(模型上下文协议),由 Anthropic 公司(也就是开发 Claude 模型的公司)推出的一个开放标准协议。它如同智能交互领域的 “通用插头” 或 “USB 接口”,通过制定统一规范,实现 AI 模型与外部资源的无缝对接。无论是连接数据库、调用第三方 API,还是访问本地文件,MCP 都能有效解决 AI 模型与外部数据源、工具间的交互难题,为 AI 应用拓展了更广阔的可能性。

实战-企业知识库

实战-交互式BI报表

实战-AI搜索类应用

实战-AI运营助手