人工智能全景认知：从入门开始......AI 进化的原理，其实和人脑是完全一样的，从机器学习，到深度学习，再到现在的pr

背景

几个月前，chatGPT 刚出来的时候，就知道它会掀起一波热潮，但没想到会这么猛烈，席卷美国和中国互联网基本所有的公司。

有人可能会问，chatGPT 不就是一个聊天机器人吗？而且回答问题还不完美，有那么夸张吗？值得所有人这么重视吗？chatGPT 远不止一个聊天机器人，它使得人类离AGI（通用人工智能）迈进了一大步，很多领域和行业都会被彻底颠覆。目前国内各大厂都在争先恐后推出自己的“chatGPT”。

目前我每天基本慢慢脱离了 baidu 搜索、google 搜索等等(减少了很大频率)，因为它们都不够精准，只能做一些模糊匹配，甚至还带一堆广告，让我在“茫茫人海寻找对的那个人”，属实有点难，现在有啥问题基本都是去找 chatGPT 了......

人工智能已经开始疯狂渗透我的生活了......那么我们对人工智能的全景认知：从入门开始......

AIGC

AIGC 即 AI Generated Content，是指利用人工智能技术来生成内容，AIGC 也被认为是继 UGC、PGC 之后的新型内容生产方式，AI 绘画、AI 写作等都属于 AIGC 的分支。对 AIGC 来说，2022 年被认为是其发展速度惊人的一年。

大家近几个月也是接触了大量的 AIGC 相关的内容，但是很多人对其中的一些内容仍然缺乏了解，接下来我们就从入门开始......

chatGPT 和 GPT3 有何区别?

我们可能有些许疑问，比如：GPT3 和 chatGPT 都是 OpenAl 开发的语言模型，那它们之间有什么区别呢?

什么是 chatGPT?

ChatGPT 是一种更小、更专业的语言模型，专为聊天应用程序设计。它基于相同的 GPT-3 技术构建，但已经过微调以处理会话语言的特定挑战，例如理解上下文、识别意图和提供适当的响应。与通用语言模型 GPT-3 不同，chatGPT 专注于提供自然且引人入胜的对话体验。

ChatGPT 具有几个关键特性和功能，使其成为 NLP 任务的强大语言模型。其中一些包括：

类人响应：ChatGPT 经过训练可以生成类似于人类在特定情况下的响应方式的响应。这使它能够与用户进行自然的类似人类的对话。
上下文感知：ChatGPT 能够维护上下文并跟踪对话的流程，即使在复杂或多轮对话中也能提供适当的响应。
大训练数据：ChatGPT 在大量文本数据上进行训练，这使其能够学习广泛的语言模式和风格。这使得它能够产生多样化和细微的反应。

什么是 GPT-3?

GPT-3 是 OpenAl 的第三代 GPT 系列模型。它是有史以来最大、最强大的语言模型之一，拥有 1750 亿个参数，GPT-3 旨在执行各种语言处理任务，包括语言翻译摘要和文本生成。

GPT-3 具有几个关键特性和功能，包括可用于广泛的语言相关任务，包括翻译、摘要和文本生成，这使其成为可应用于各种应用的多功能模型。

chatGPT 和 GPT-3 的区别是什么?

GPT-3 和 chatGPT 之间的主要区别在于它们的范围和目的。

GPT-3 是一种大型通用语言模型，可以处理各种语言处理任务。
另一方面，ChatGPT 是一个较小的专用模型，专为聊天应用程序设计。虽然这两种模型都基于相同的底层技术，但 chatGPT 是根据会话语言处理的特定需求量身定制的。

Stable Diffusion 和 Midjourney 的区别?

什么是 Stable Diffusion?

Stable Diffusion 是一个文转图的模型，其使用了 CLIP ViT-L/14 文本编码器，能够通过文本提示调整模型。它在运行时将成像过程分离成"扩散(diffusion)"的过程--从有噪声的情况开始，逐渐改善图像，直到完全没有噪声，逐步接近所提供的文本描述。

什么是 Midjourney?

Midjourney 也是一款由人工智能驱动的工具，其能够根据用户的提示生成图像，Midlourney 善于适应实际的艺术风格，创造出用户想要的任何效果组合的图像。它擅长环境效果，特别是幻想和科幻场景，看起来就像游戏的艺术效果。

Stable Diffusion 和 Midjourney 之间的比较

Midjourney 是一个以其艺术风格闻名的工具。

Midjourney 使用其 Discord 机器人来发送以及接收对 AI 服务器的请求，几乎所有的事情都发生在 Discord 上。

由此产生的图像很少看起来像照片，似乎更像一幅画。

Stable Diffusion 是一个开源的模型，人人都可以使用。

它对当代艺术图像有比较好的理解，可以产生充满细节的艺术作品。

然而它需要对复杂的 prompt 进行解释。

Stable Diffusion 比较适合生成复杂的、有创意的插图。但在创作一般的图像时就显得存在些许不足。

下面的 prompt 有助于了解每种模型的相似性和差异。

A cartoon cat playing football (一只卡通猫咪踢足球)

这个是我作为一只“铲屎官”，看到自家猫咪喜欢玩球之类的，玩的挺好的，有种踢足球的感觉，所以希望有组织能做这么一个主题的动漫！

Midjourney 效果

Stable Diffusion

我们可以看到针对同一句 prompt 生成的图像有较大的差异，Midjourney 的画面充满艺术性，像一幅完整的动漫画作，而 Stable Diffusion 生成的图像更像是一张逗我玩的涂鸦。

不同的 prompt 生成出的图像也有巨大的差别，希望大家，可以继续探索学习驯化模型，运用平台生成更精美的图像。

认识 Midjourney 的 Prompt

如何使用 Midjourney 做出更好效果的图片？

Prompt 是 Midjourney 中一个非常重要的概念，它类似于一句指令或灵感，用于指导 AI 生成特定主题或视觉风格的图片。

在 Midjourney 中，用户可以通过输入自定义的 Prompt，让 AI 生成不同的图像。Prompt 不仅仅是文本，还可以使用图片以及各种参数，Midiourney 会使用AI 算法分析并理解输入的信息，所以熟练运用 Prompt 非常重要。

简单 Prompt

一个简单的 Prompt 可以只有一串文本，甚至只有一个单词就可以，用来告诉 AI 你想画什么。

比如：漫画一个电竞少女，带着粉色的耳机，坐在电脑桌前，一台电脑放在桌上，游戏画面，浅灰色的长发，蓬松的头发，可爱，淡淡的腮红，空旷的房间，床上有几盆花朵，丁达尔效应

然后 AI 生成了下面这种风格的的4张图片：

关于 Prompt 的几个 Tips：

描述尽量具体：如果你有确定的图片需求，描述词尽可能具体，以获得更符合预期的结果，否则出来的效果与你想的可能大相径庭，不过如果你只是想探索一番，可以不用那么具体以获得更丰富多样的图片，有时会出现一些意外和惊喜。
只描述你想要的：只描述你想要的内容，而不是说你不想要的。
不断尝试和调整：在使用 Midjourney 时，需要不断尝试不同的Prompt，并根据结果进行调整和优化。可以从颜色、构图、细节、参数等多方面入手，对 Prompt 进行微调，以获得更好的创作效果，几乎不可能一两次就能立即获得满意的图片。

打开 MidJourney 官网，目前已经开放公测，所有用户均可使用

官网：www.midjourney.com/home

chatGPT 的原理及作用?

大概了解了 chatGPT 的基本理念，它的全称是 Generative Pre-trained Transformer，生成式预训练转换器。

简单来说，它的原理是：

先给它提供一个庞大的语料库(通常是直接从互联网上抓来的)，让模型通过上千亿个参数对这些文本进行打散标记、学习，构建起一个复杂的预测模型。

然后再依据这个预测模型，判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来，形成一段话，或者一篇文章。

这种预测的模式，其实跟我们大脑的学习和加工模式是非常相似的。

因此，这也是它能够更“像人”的一个重要原因。

三层模型理解

这个模型背后无需人工参与的“无监督”式预训练自学习原理，或者说让模型像大脑“自由生长"的过程，就是它的动力层。

借由这个原理所完成的 GPT-3.5，就是一个结构层，是 ChatGPT 起作用的主要基础。

而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT，就是一个交互层，它的本质就是加了一层更友好的用户界面和交互方式，让个人用户能够更容易地应用它。

了解完 ChatGPT 的原理，我们自然会关心一个问题：就目前而言，ChatGPT 究竟能做什么?

chatGPT的作用

1.回答问题

这可能是 ChatGPT 最简单的应用。你在聊天界面里向它提问，比如“波粒二象性是什么意思”，它就会用流畅的语言向你解释，把这个概念讲解得非常清楚。就我试用的体验而言，效果非常好，简洁晓畅，表达能力胜过许多人。

2.撰写文章

你可以向它提要求，让它按照你的要求撰写一篇文章。例如:

3.撰写邮件

4.撰写策划方案

你可以给它一个主题，再给一些背景和指引，甚至让它帮你想创意、提供各种不同方向的点子和灵感。

5.撰写报告

你可以给它一些数据，让它根据这些材料撰写一份报告。等等。

总之，ChatGPT 具备极强的总结提炼信息的能力，但是 AI 只是帮我们拓展触及信息的能力，处理信息和做出决策的人依然是我们自己。而不是依赖于它给出的解释和答案，让它替代我们去决策和判断。一旦我们放弃了思考，我们作为人类的主体性其实也就不复存在。

拓展

除了现在最常见的：

内容生产 CoPilot（ChatGPT、Midjourney），

还有：

办公 CoPilot（微软 Office CoPilot）、
搜索 CoPilot（微软 New bing）、
编程 CoPilot（微软 GitHub CoPilot）、
教育 CoPilot（可汗学院、Speak、多邻国），
以及基于 ChatGPT Plugins 的接入了多个插件的生活服务 CoPilot。

其实还有更多，万物都可以 +GPT，万物都可以 CoPilot。

感受

人工智能带给我的感受：

一个人的认知，是需要不断的进化的，而进化主要靠和其他人的交流，获取到更多新的信息和他人的认知，然后认真学习吸收，从而迭代自己的认知。

一个人能力提升的速度，基本取决于他能链接到的信息的强度，和自己迭代的速度。

再说直白点，只要你能找到可以学习的牛人，你自己也愿意走出舒适区，愿意持续学习和思考，你就能进步，否则就是停滞不前，甚至被时代淘汰。

AI 进化的原理，其实和人脑是完全一样的，从机器学习，到深度学习，再到现在的pre-train 自监督大模型 + 生成式 AI，AI 越来越逼近人脑的机制。

AI 它也能帮助我们学习成长，帮助我们找学习资料，帮助我们解决疑难问题......就看怎么利用，会用不会用 AI，首先最重要的就是学会精准的表达，把你的需求精准的告诉 AI，它才能更好的帮助你。