人工智能全景认知:从入门开始......

1,098 阅读10分钟

本文正在参加「金石计划」

背景

几个月前,chatGPT 刚出来的时候,就知道它会掀起一波热潮,但没想到会这么猛烈,席卷美国和中国互联网基本所有的公司。

有人可能会问,chatGPT 不就是一个聊天机器人吗?而且回答问题还不完美,有那么夸张吗?值得所有人这么重视吗?chatGPT 远不止一个聊天机器人,它使得人类离AGI(通用人工智能)迈进了一大步,很多领域和行业都会被彻底颠覆。目前国内各大厂都在争先恐后推出自己的“chatGPT”。

目前我每天基本慢慢脱离了 baidu 搜索、google 搜索 等等(减少了很大频率),因为它们都不够精准,只能做一些模糊匹配,甚至还带一堆广告,让我在“茫茫人海寻找对的那个人”,属实有点难,现在有啥问题基本都是去找 chatGPT 了......

人工智能已经开始疯狂渗透我的生活了......那么我们对人工智能的全景认知:从入门开始......

AIGC

image.png

AIGC 即 AI Generated Content,是指利用人工智能技术来生成内容,AIGC 也被认为是继 UGCPGC 之后的新型内容生产方式,AI 绘画、AI 写作等都属于 AIGC 的分支。对 AIGC 来说,2022 年被认为是其发展速度惊人的一年。

大家近几个月也是接触了大量的 AIGC 相关的内容,但是很多人对其中的一些内容仍然缺乏了解,接下来我们就从入门开始......

chatGPT 和 GPT3 有何区别?

我们可能有些许疑问,比如:GPT3 和 chatGPT 都是 OpenAl 开发的语言模型,那它们之间有什么区别呢?

什么是 chatGPT?

ChatGPT 是一种更小、更专业的语言模型,专为聊天应用程序设计。它基于相同的 GPT-3 技术构建,但已经过微调以处理会话语言的特定挑战,例如理解上下文、识别意图和提供适当的响应。与通用语言模型 GPT-3 不同,chatGPT 专注于提供自然且引人入胜的对话体验

ChatGPT 具有几个关键特性和功能,使其成为 NLP 任务的强大语言模型。其中一些包括:

  • 类人响应:ChatGPT 经过训练可以生成类似于人类在特定情况下的响应方式的响应。这使它能够与用户进行自然的类似人类的对话。
  • 上下文感知:ChatGPT 能够维护上下文并跟踪对话的流程,即使在复杂或多轮对话中也能提供适当的响应。
  • 大训练数据:ChatGPT 在大量文本数据上进行训练,这使其能够学习广泛的语言模式和风格。这使得它能够产生多样化和细微的反应。

什么是 GPT-3?

GPT-3 是 OpenAl 的第三代 GPT 系列模型。它是有史以来最大、最强大的语言模型之一,拥有 1750 亿个参数,GPT-3 旨在执行各种语言处理任务,包括语言翻译摘要和文本生成。

GPT-3 具有几个关键特性和功能,包括可用于广泛的语言相关任务,包括翻译、摘要和文本生成,这使其成为可应用于各种应用的多功能模型。

chatGPT 和 GPT-3 的区别是什么?

GPT-3 和 chatGPT 之间的主要区别在于它们的范围和目的

  • GPT-3 是一种大型通用语言模型,可以处理各种语言处理任务。
  • 另一方面,ChatGPT 是一个较小的专用模型,专为聊天应用程序设计。虽然这两种模型都基于相同的底层技术,但 chatGPT 是根据会话语言处理的特定需求量身定制的。

image.png

Stable Diffusion 和 Midjourney 的区别?

什么是 Stable Diffusion?

Stable Diffusion 是一个文转图的模型,其使用了 CLIP ViT-L/14 文本编码器,能够通过文本提示调整模型。它在运行时将成像过程分离成"扩散(diffusion)"的过程--从有噪声的情况开始,逐渐改善图像,直到完全没有噪声,逐步接近所提供的文本描述。

什么是 Midjourney?

Midjourney 也是一款由人工智能驱动的工具,其能够根据用户的提示生成图像,Midlourney 善于适应实际的艺术风格,创造出用户想要的任何效果组合的图像。它擅长环境效果,特别是幻想和科幻场景,看起来就像游戏的艺术效果。

Stable Diffusion 和 Midjourney 之间的比较

Midjourney 是一个以其艺术风格闻名的工具。

Midjourney 使用其 Discord 机器人来发送以及接收对 AI 服务器的请求,几乎所有的事情都发生在 Discord 上。

由此产生的图像很少看起来像照片,似乎更像一幅画。

Stable Diffusion 是一个开源的模型,人人都可以使用。

它对当代艺术图像有比较好的理解,可以产生充满细节的艺术作品

然而它需要对复杂的 prompt 进行解释。

Stable Diffusion 比较适合生成复杂的、有创意的插图。但在创作一般的图像时就显得存在些许不足。

下面的 prompt 有助于了解每种模型的相似性和差异。

A cartoon cat playing football (一只卡通猫咪踢足球)

这个是我作为一只“铲屎官”,看到自家猫咪喜欢玩球之类的,玩的挺好的,有种踢足球的感觉,所以希望有组织能做这么一个主题的动漫!

Midjourney 效果

image.png

Stable Diffusion

image.png

我们可以看到针对同一句 prompt 生成的图像有较大的差异,Midjourney 的画面充满艺术性,像一幅完整的动漫画作,而 Stable Diffusion 生成的图像更像是一张逗我玩的涂鸦。

不同的 prompt 生成出的图像也有巨大的差别,希望大家,可以继续探索学习驯化模型,运用平台生成更精美的图像。

认识 Midjourney 的 Prompt

如何使用 Midjourney 做出更好效果的图片?

Prompt 是 Midjourney 中一个非常重要的概念,它类似于一句指令或灵感,用于指导 AI 生成特定主题或视觉风格的图片。

在 Midjourney 中,用户可以通过输入自定义的 Prompt,让 AI 生成不同的图像。Prompt 不仅仅是文本,还可以使用图片以及各种参数,Midiourney 会使用AI 算法分析并理解输入的信息,所以熟练运用 Prompt 非常重要。

简单 Prompt

一个简单的 Prompt 可以只有一串文本,甚至只有一个单词就可以,用来告诉 AI 你想画什么。

比如:漫画 一个电竞少女,带着粉色的耳机,坐在电脑桌前,一台电脑放在桌上,游戏画面,浅灰色的长发,蓬松的头发,可爱,淡淡的腮红,空旷的房间,床上有几盆花朵,丁达尔效应

然后 AI 生成了下面这种风格的的4张图片:

image.png

关于 Prompt 的几个 Tips:

  1. 描述尽量具体:如果你有确定的图片需求,描述词尽可能具体,以获得更符合预期的结果,否则出来的效果与你想的可能大相径庭,不过如果你只是想探索一番,可以不用那么具体以获得更丰富多样的图片,有时会出现一些意外和惊喜。
  2. 只描述你想要的:只描述你想要的内容,而不是说你不想要的。
  3. 不断尝试和调整:在使用 Midjourney 时,需要不断尝试不同的Prompt,并根据结果进行调整和优化。可以从颜色、构图、细节、参数等多方面入手,对 Prompt 进行微调,以获得更好的创作效果,几乎不可能一两次就能立即获得满意的图片。

打开 MidJourney 官网,目前已经开放公测,所有用户均可使用

官网:www.midjourney.com/home

chatGPT 的原理及作用?

大概了解了 chatGPT 的基本理念,它的全称是 Generative Pre-trained Transformer,生成式预训练转换器

简单来说,它的原理是:

先给它提供一个庞大的语料库(通常是直接从互联网上抓来的),让模型通过上千亿个参数对这些文本进行打散标记、学习,构建起一个复杂的预测模型

然后再依据这个预测模型,判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来,形成一段话,或者一篇文章。

这种预测的模式,其实跟我们大脑的学习和加工模式是非常相似的。

因此,这也是它能够更“像人”的一个重要原因。

三层模型理解

这个模型背后无需人工参与的“无监督”式预训练自学习原理,或者说让模型像大脑“自由生长"的过程,就是它的动力层

借由这个原理所完成的 GPT-3.5,就是一个结构层,是 ChatGPT 起作用的主要基础。

而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT,就是一个交互层,它的本质就是加了一层更友好的用户界面和交互方式,让个人用户能够更容易地应用它。

了解完 ChatGPT 的原理,我们自然会关心一个问题:就目前而言,ChatGPT 究竟能做什么?

chatGPT的作用

1.回答问题

这可能是 ChatGPT 最简单的应用。你在聊天界面里向它提问,比如“波粒二象性是什么意思”,它就会用流畅的语言向你解释,把这个概念讲解得非常清楚。就我试用的体验而言,效果非常好,简洁晓畅,表达能力胜过许多人。

2.撰写文章

你可以向它提要求,让它按照你的要求撰写一篇文章。例如:

image.png

3.撰写邮件

image.png

4.撰写策划方案

你可以给它一个主题,再给一些背景和指引,甚至让它帮你想创意、提供各种不同方向的点子和灵感。

image.png

5.撰写报告

你可以给它一些数据,让它根据这些材料撰写一份报告。等等。

image.png

总之,ChatGPT 具备极强的总结提炼信息的能力,但是 AI 只是帮我们拓展触及信息的能力,处理信息和做出决策的人依然是我们自己。而不是依赖于它给出的解释和答案,让它替代我们去决策和判断。一旦我们放弃了思考,我们作为人类的主体性其实也就不复存在。

拓展

除了现在最常见的:

  • 内容生产 CoPilot(ChatGPT、Midjourney),

还有:

  • 办公 CoPilot(微软 Office CoPilot)、
  • 搜索 CoPilot(微软 New bing)、
  • 编程 CoPilot(微软 GitHub CoPilot)、
  • 教育 CoPilot(可汗学院、Speak、多邻国),
  • 以及基于 ChatGPT Plugins 的接入了多个插件的生活服务 CoPilot。

其实还有更多,万物都可以 +GPT,万物都可以 CoPilot

感受

人工智能带给我的感受:

一个人的认知,是需要不断的进化的,而进化主要靠和其他人的交流,获取到更多新的信息和他人的认知,然后认真学习吸收,从而迭代自己的认知。

一个人能力提升的速度,基本取决于他能链接到的信息的强度,和自己迭代的速度。

再说直白点,只要你能找到可以学习的牛人,你自己也愿意走出舒适区,愿意持续学习和思考,你就能进步,否则就是停滞不前,甚至被时代淘汰。

AI 进化的原理,其实和人脑是完全一样的,从机器学习,到深度学习,再到现在的pre-train 自监督大模型 + 生成式 AI,AI 越来越逼近人脑的机制。

AI 它也能帮助我们学习成长,帮助我们找学习资料,帮助我们解决疑难问题......就看怎么利用,会用不会用 AI,首先最重要的就是学会精准的表达,把你的需求精准的告诉 AI,它才能更好的帮助你。