大语言模型-LLM概述大语言模型（LLM）是一种用于生成自然语言文本的深度学习模型，通常采用神经网络来学习语言的结构和规

大语言模型（Large-Language-Model，LLM）

大语言模型是一种用于生成自然语言文本的深度学习模型，通常采用神经网络来学习语言的结构和规律，并用这些知识来反复预测输入字符的下一个字符来生成新的文本。大语言模型通常需要大量的训练数据和计算资源，以便在生成文本方面达到高质量的效果。

大模型的定义关键词是：大、语言模型

【一些理解误区】

大模型越问越聪明：模型聪明程度与模型参数相关，参数都是在预训练阶段产生的，部署后的模型被称为“Frozen LLM”，不会随着不断提问产生参数
大模型知道事实本身：大模型不“记忆”任何事实，而是通过学习数据中的模式、关系和统计规律来生成输出，通过训练过程转化为模型的参数。所有看似“知道”，都是基于参数对输入的“推理”结果
大模型知道现在发生的事：大模型本身部署后，参数不发生变化，原则上只知道部署前用于训练的事实，而无法知晓之后发生的新事件。为了弥补这一局限性，大模型通常会结合传统搜索和信息检索技术（如RAG）来获取最新的信息。
大模型对同一个问题总能做出固定的答案：大模型答题过程，本质是基于参数对输入进行推理，但不代表每次推理的路径和结果是一致的，稳定和联想的要求是相悖的，但可以通过明确解题步骤让大模型的输出结果趋于统一。