极智AI | HuggingGPT让ChatGPT联网大家好，我是极智视界，本文来谈谈 HuggingGPT让ChatG

欢迎关注我的公众号 [极智视界]，获取我的更多经验分享

大家好，我是极智视界，本文来谈谈 HuggingGPT让ChatGPT联网。

邀您加入我的知识星球「极智视界」，星球内有超多好玩的项目实战源码下载，链接：t.zsxq.com/0aiNxERDq

你知道ChatGPT的最大缺陷是什么吗？我觉得是不能联网，这个意思是说对于新的知识或者比较新的知识它是不能马上学习到的，而这就跟咱们人类很不一样，人类可以很轻松的进行实时学习。GPT每训练完一轮，它的知识就停留在了那里，要想进一步增加知识就得继续训练，正是由于训练的成本太高周期较长，导致这种知识的更迭周期也相对比较停滞，从这种意义上来说ChatGPT就像是离线的。

而HuggingGPT就像是给ChatGPT插上了网线，到这里其实有些同学可能还不清楚HuggingGPT是什么，来先介绍一下。HuggingGPT使用的整个过程是：使用ChatGPT作为控制器(理解你的输入)，连接HuggingFace社区中的各种AI模型，完成多模态复杂任务。所以HuggingGPT的使用方式，极大地弱化了人们对于ChatGPT AIGC能力的需求，HuggingGPT将ChatGPT的角色切为输入的理解器(也可以理解为输入的解析器parser)，而真正的AI能力的提供者来自于HuggingFace社区众多的集大众之精华的大模型。这样的模式已经颠覆了之前主要依靠ChatGPT的AIGC能力的方式，HuggingGPT采用ChatGPT链接到了HuggingFace社区，这就像给ChatGPT插上了网线一样，HuggingGPT 绝对是一下子打开了大模型应用的大门。

下图展示了一个HuggingGPT处理多模态需求的一个例子，并展示了HuggingGPT的工作流程。

首先输入的需求是：

Please generate an image where a girl is reading a book, and her pose is the same as the boy in the image example.jpg. Then please describe the new image with your voice.

很明显，这个需求是比较难的，首先需要生成一张看书的小女孩的图像，而且不是随机生成的，是需要跟输入图像中男孩的姿态是一致的，最后还需要用语音来描述这个图像。这其中涉及的技术至少包括了文本理解、图像生成、姿态识别、语音生成，这对于以往的相对单应用的大模型如ChatGPT，甚至新出的GPT-4，都是"望而却步的"。但这里的HuggingGPT就可以做到，靠的就是ChatGPT的输入理解能力链接了HuggingFace社区众多大模型的能力来实现(相信不久后咱们的魔塔GPT可能就要来了)。来看看HuggingFace的模型库，你就能了解它的能力有多强。

所以这里的大模型的能力早就不是单模型的能力了，是整个大模型ModelZoo(Huggingface)的能力(以前咱们使用HuggingFace可能还需要一个个调用，现在不用了)，这种调用大模型能力的方式已经完全解放了大模型们的能力，AI真的越来越好玩了。

再看看咱们的魔塔什么时候能出魔塔GPT吧~

好了，以上分享了 HuggingGPT让ChatGPT联网。希望我的分享能对你的学习有一点帮助。

【公众号传送】

《极智AI | HuggingGPT让ChatGPT联网》

畅享人工智能的科技魅力，让好玩的AI项目不难玩。邀请您加入我的知识星球， 星球内我精心整备了大量好玩的AI项目，皆以工程源码形式开放使用，涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。不敢说会对你学习有所帮助，但一定非常好玩，并持续更新更加有趣的项目。 t.zsxq.com/0aiNxERDq