聊天机器人-AI基础系列文章第10篇

146 阅读3分钟

您的关注是对我最大的支持👇

image.png

在人工智能领域,有各种类型的语言模型(LLMs),用于不同的目的。在这门课程中最常用的模型之一是ChatGPT,它是一个能够记住之前消息的聊天机器人,因此您可以与它进行对话。然而,聊天机器人并不是唯一的LLM类型。另一个例子是GPT-3,这是OpenAI开发的早期人工智能模型,与聊天机器人不同,它没有记忆。GPT-3和ChatGPT都可以执行基本任务,如回答问题和生成摘要。

聊天机器人的工作原理

像ChatGPT这样的聊天机器人旨在模拟交互式对话。为了进行对话,聊天机器人必须记住整个对话历史。对于像ChatGPT这样的人工智能来说,这意味着每次您发送新消息时,它们会同时阅读您们之前发送的所有消息,因为它们没有真正的记忆。这种对话的“记忆”是区分它们与非聊天机器人的唯一重要因素。

非聊天机器人

GPT-3是一种完整的模型类型,而不是聊天机器人。以下是一个示例,展示了它与ChatGPT的区别:

提示词:

What is 2+

GPT3返回结果:

2

2+2 = 4

ChatGPT返回结果:

看起来您的问题没有完成。如果您的问题是"2 + 2等于多少?",那么答案是4。如果您有其他问题或需要进一步帮助,请随时提问!

我们可以看到,GPT-3根据其认为最可能的下一个字符完成了我们的输入。另一方面,ChatGPT则回应我们,好像我们突然在对话中停止说话一样。聊天机器人的对话性使得使用它们更加自然,所以大多数人更喜欢它们而不是其他人工智能。然而,聊天机器人更好的最重要的原因是,像OpenAI和Anthropic这样的公司已经构建了非常智能的聊天机器人,并且能够更好地响应您的提示。

标记

像ChatGPT这样的通用人工智能并不像我们一样逐字逐句地阅读单词。当我们阅读句子"I don't like eggs"时,它们可能会将其分解成自己的词汇版本,并按照以下方式阅读:"I, don, 't like egg s"。这些"词汇"被称为标记(tokens),几乎在每个现代通用人工智能中都会使用。然后,每个标记都被转换为一个数字列表,以便AI可以处理它。您不需要知道为什么通用人工智能使用标记,但在考虑定价和上下文长度时,它们是重要的理解要素。

上下文长度

上下文长度指的是语言模型在生成响应时可以考虑的文本量。对于聊天机器人和非聊天机器人,它们都有一个最大上下文长度的限制。如果对话或文本超过这个限制,模型在生成响应时将无法记住整个对话。这就是为什么有时需要重申重要信息或重新引导聊天机器人的原因。

750个单词大约是1,000个标记。ChatGPT可以记住4K个标记,而更高级的ChatGPT版本可以记住多达16K个标记。GPT-4可以处理多达32K个标记,而Anthropic的AI——Claude可以处理多达100K个标记。决定使用哪个模型有时是在定价和对更长上下文长度的需求之间进行权衡。ChatGPT对于这门课程来说已经足够了。

关注我,跟踪最新AI消息


明日预告

《聊天机器人预热-AI基础系列文章第11篇》

通过使用第一个提示来 "预热" 聊天机器人,从而设定对话的结构和风格。这样可以让您对整个对话有精细的控制。