"AI名词解析:从UGC到SOTA,跟上时代的潮流说法"

91 阅读5分钟

了解常用的专有名词,探索AI的世界

在如今日益发展的人工智能领域中,我们经常会遇到一些特定的术语和概念。熟悉这些专有名词可以帮助我们更好地理解人工智能模型的运作原理,并使得AI的回答更加符合我们的需求。

在本文中,我们将介绍一些常见的专有名词,这些名词在OpenAI和ChatGPT提示工程中被广泛使用。从AI、PGC到CoT等,每个名词都有其独特的含义和用途。让我们一起深入探索这个充满奇迹的AI世界吧!

名词对照表

英文中文/全称描述
AI人工智能(Artificial Intelligence)是一个以计算机科学(Computer Science)为基础,由计算机、心理学、哲学等多学科交叉融合的交叉学科、新兴学科,研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学
PGC专业生产内容(Professional Generated Content)PGC(Professionally-generated Content,专业生成内容),互联网术语,即专业生成内容,也称PPC(Professionally-produced Content)。指专业生成内容(视频网站)、专家生成内容(微博)等等。
UGC用户生成内容(User Generated Content)UGC 互联网术语,全称为User Generated Content,也就是用户生成内容,即用户原创内容。
AIGC人工智能生成内容(Artificial Intelligence Generated Content)指基于人工智能通过已有数据寻找规律,并自动生成内容的生产方式。
transformer变换器是一种采用自注意力机制的深度学习模型
GPTGenerative pre-trained transformer基于transformer的生成式预训练模型(Generative pre-trained transformer),一个人工智能语言模型系列。
LLM大语言模型(Large Language Model)大语言模型LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。
Prompt提示一段给AI的提示,以对话的形式呈现
Prompt engineering提示工程和AI对话的工程技术
Completion完成AI根据提示生成的回答或者输出
Embedding内嵌将文字或韵律转换为数字向量的技术,使得AI能够理解和处理文字。
Token标记/令牌语言模型理解和处理文本的基本单位,可以是一字、一词或一字符。
TPM每分钟令牌数(tokens per minute)OpenAI API每分钟Token请求数量
RPM每分钟请求次数(Requests Per Minute )OpenAI API每分钟请求次数
Model模型AI的核心,它学习并理解数据的方式
Resource资源创建一个服务即为Resource
Deployment部署让AI模型能够被使用
In-context learning情境中学习AI在对话的情境中学习和适应的能力
Few-shot少量样本提供数据例子,AI更妥善地针对目前的推断回应。
One-shot一次样本提供一个例子,AI针对目前的推断回应。
Zero-shot零样本不提供范例,AI根据语言模型直接做出回应。
Temperature温度控制随机性。降低温度意味着模型会产生更多重复性和确定性的回复。提高温度会导致更多意外或创造性的回复。请尝试调整温度或 Top P 值,但不要同时调整两者。
Max length (tokens)最大长度(标记)对每个模型回复的标记数设置限制。该 API 支持最多 4096 个标记,包括提示(包括系统消息、示例、消息历史记录以及用户查询)和模型的回复。对于典型的英文文本,一个标记大约是四个字符。
Top probabilities概率最高值与温度类似,它控制着随机性,但使用不同的方法。降低 Top P 值会将模型的标记选择范围缩小到可能性更高的标记。增加 Top P 值会使模型既选择可能高的标记又选择可能性低的标记。请尝试调整温度或 Top P 值,但不要同时调整两者。
Multi-turn conversations多回合对话选择要包含在每个新 API 请求中的过去消息数。这有助于为新用户查询提供模型上下文。将此数字设置为 10 即表示 5 个用户查询和 5 个系统回复。
Stop sequences停止序列停止序列使模型在所需时间点结束响应。模型响应会在指定序列之前结束,因此它不包含停止序列文本。对于 ChatGPT,使用 im_end 可确保模型响应不会生成后续用户查询。可以包含多达四个停止序列。
Fine-tunes微调给模型提供数据,对模型进行微调
Engine引擎GPT不同能力的 AI 模型
SLA服务级别协议专门用于描述了产品正常运行时间和连接性的承诺的协议
SOTAstate-of-the-art用于描述机器学习中取得某个任务上当前最优效果的模型
CoTChain-of-Thought提示工程中使用的一种方法被称为链式思考(Chain-of-Thought,简称CoT)提示,这种方法为语言模型提供了少数的任务示例,以提高其推理能力。这种方法首次由Google的研究人员在2022年提出,并已经在改善大型语言模型(LLMs)的推理能力方面取得了效果。例如,在一个多步骤的问题中,CoT提示会引导模型在给出最终答案之前产生中间的推理步骤

在AI的引导下,开启智能化的未来

随着人工智能技术的不断发展与创新,越来越多的专业术语被引入到我们的日常生活中。从AI生成内容到Transformer模型的应用,我们对人工智能的认知也在逐步提升。

通过熟悉并理解这些专有名词,我们能更好地与AI进行交流与合作,创造出更加智能化和高效的解决方案。让我们共同开启智能化的未来,探索人工智能技术为我们带来的无限可能性吧!