《SpringAI入门教程》2. SpringAI介绍大模型介绍 AI 模型是旨在处理和生成信息的算法，通常模仿人类的认

1. 大模型介绍

AI 模型是旨在处理和生成信息的算法，通常模仿人类的认知功能。通过从大兴数据集中学习模式和见解，这些模型可以做出预测、文本、图像和其他形式输出，从而增强各个行业的各种应用。

Spring AI 是一个面向人工智能工程的应用框架，解决了 AI 集成的基本挑战：将企业数据和 API 与 AI 大模型 连接起来。

AI 模型根据 数据类型 ，大致可以分为很多种，每种都适用于特定的用例。SpringAI目前支持：语言、图像和音频形式处理输入和输出的模型。

Embedding Model 通常接受文本作为输入并输出数字，通常称为嵌入文本（Embedding Text），用来表示 AI 模型中使用的内部数据结构。SpringAI提供了对Embedding的支持以支持开发更高级的应用场景。

Prompt作为语言基础输入的基础，知道AI模型生成特定的输出。

ChatGPT的API包含多个文本输入，每个文本输入都有其角色。

系统角色：用于告知模型如何行为并设定交互的背景。

用户角色：通常是来自用户的输入。

创建有效的Prompt设计建立请求的上下文，并用用户输入的特定值替换请求的部分内容。这个过程使用传统的基于文本的模版引擎来进行Prompt的创建和管理。SpringAI采用开源库StringTemplate来实现这一目的。

嵌入（Embedding）是文本、图像或视频的数值表示，能够捕捉输入之间的关系，Embedding通过将文本、图像和视频转换为称为向量(Vector)的浮点数数组来工作。这些向量旨在捕捉文本、图像和音视频的含义，Embedding数组的长度称为向量的维度。

通过计算两个文本片段的向量表示之间的数值举例，应用程序可以确定用于生成嵌入向量的对象之间的相似性。

token是AI模型工作原理的基石。输入时，模型将单词转换为 token。输出时，将token转换成单词。

在英语中，一个token大约对应一个单词的75%。

在托管AI模型的背景下，费用由使用的token数量决定，输入和输出都会影响总token数量。

模型还受到token限制，这会限制单个API调用中处理的文本量。此阈值通常称为“上下文窗口”。模型不会处理超出此限制的任何文本。

设计创建Prompt以产生预期的输出，然后将生成的简单字符串转换为可用于应用程序集成的数据结构。

定制模型并修改模型内部权重，将内部数据和API引入模型

将数据嵌入到提供给模型的提示词中，将内部数据和API引入模型

旨在解决为AI模型提供额外的知识输入，以辅助模型更好的回答问题。

先对数据进行 ETL处理（extract、transformer、load），入向量库、LLM处理

大模型语言模型，是基于已有数据训练的，这就导致无法感知实时数据。

Function Calling解决了这个问题，它允许我们注册自己的函数，将LLM链接到外部系统的API，这些系统可以为LLM提供实时数据并代表他们执行数据处理操作。

步骤解释：

（1）执行聊天请求并发送函数定义信息。后者提供name（description例如，解释模型何时应调用该函数）和input parameters（例如，函数的输入参数模式）。
（2）当模型决定调用该函数时，它将使用输入参数调用该函数，并将输出返回给模型。
（3）Spring AI 为您处理此对话。它将函数调用分派给适当的函数，并将结果返回给模型。
（4）模型可以执行多个函数调用来检索所需的所有信息。
（5）一旦获取了所有需要的信息，模型就会生成响应。

有效评估人工智能系统回答的正确性，对于确保最终应用程序的准确性和实用性非常重要。 Evaluation 评估过程设计分析响应是否符合用户的意图，与查询的上下文强相关，一些指标如相关性、连贯性和事实正确性等都被用于衡量AI生成的响应的质量。

厂商	代表模型 / 系列	适用行业 / 应用场景
OpenAI	GPT-4o 多模态、GPT-5 强化数学和编码能力	通用创作、客服、研发辅助、教育等
Anthropic	Claude 3 / Claude 4 系列，支持超长上下文 200k tokens	企业文档、推理分析、法律/金融应用
Google (DeepMind)	Gemini 系列（Pro / Flash 等）	办公协作、翻译、代码、智能助理、研究
Meta / Mistral	Mistral Medium 3、Devstral、小模型 Llama	中小企业部署、定制化、开发、内容生成
Alibaba Cloud	Qwen 系列（Qwen 3、2.5-Omni 多模态）	电商客服、多语言、跨模态生成与交互
DeepSeek	DeepSeek R1 / V3 系列	科研、金融、教育、工程、高性能代码推理
百度	文心一言	中文场景、知识密集行业（教育、金融、内容）
腾讯	混元大模型	内容创作、文档处理、微信生态应用场景
华为	盘古模型系列	政府、金融、制造、翻译与代码等行业解决方案
国内其他厂商	百度文心一言、腾讯混元、智普、豆包等。