本文正在参加「金石计划」
背景
几个月前,chatGPT 刚出来的时候,就知道它会掀起一波热潮,但没想到会这么猛烈,席卷美国和中国互联网基本所有的公司。
有人可能会问,chatGPT 不就是一个聊天机器人吗?而且回答问题还不完美,有那么夸张吗?值得所有人这么重视吗?chatGPT 远不止一个聊天机器人,它使得人类离AGI(通用人工智能)迈进了一大步,很多领域和行业都会被彻底颠覆。目前国内各大厂都在争先恐后推出自己的“chatGPT”。
目前我每天基本慢慢脱离了 baidu 搜索、google 搜索 等等(减少了很大频率),因为它们都不够精准,只能做一些模糊匹配,甚至还带一堆广告,让我在“茫茫人海寻找对的那个人”,属实有点难,现在有啥问题基本都是去找 chatGPT 了......
人工智能已经开始疯狂渗透我的生活了......那么我们对人工智能的全景认知:从入门开始......
AIGC
AIGC 即 AI Generated Content,是指利用人工智能技术来生成内容,AIGC 也被认为是继 UGC、PGC 之后的新型内容生产方式,AI 绘画、AI 写作等都属于 AIGC 的分支。对 AIGC 来说,2022 年被认为是其发展速度惊人的一年。
大家近几个月也是接触了大量的 AIGC 相关的内容,但是很多人对其中的一些内容仍然缺乏了解,接下来我们就从入门开始......
chatGPT 和 GPT3 有何区别?
我们可能有些许疑问,比如:GPT3 和 chatGPT 都是 OpenAl 开发的语言模型,那它们之间有什么区别呢?
什么是 chatGPT?
ChatGPT 是一种更小、更专业的语言模型,专为聊天应用程序设计。它基于相同的 GPT-3 技术构建,但已经过微调以处理会话语言的特定挑战,例如理解上下文、识别意图和提供适当的响应。与通用语言模型 GPT-3 不同,chatGPT 专注于提供自然且引人入胜的对话体验。
ChatGPT 具有几个关键特性和功能,使其成为 NLP 任务的强大语言模型。其中一些包括:
- 类人响应:ChatGPT 经过训练可以生成类似于人类在特定情况下的响应方式的响应。这使它能够与用户进行自然的类似人类的对话。
- 上下文感知:ChatGPT 能够维护上下文并跟踪对话的流程,即使在复杂或多轮对话中也能提供适当的响应。
- 大训练数据:ChatGPT 在大量文本数据上进行训练,这使其能够学习广泛的语言模式和风格。这使得它能够产生多样化和细微的反应。
什么是 GPT-3?
GPT-3 是 OpenAl 的第三代 GPT 系列模型。它是有史以来最大、最强大的语言模型之一,拥有 1750 亿个参数,GPT-3 旨在执行各种语言处理任务,包括语言翻译摘要和文本生成。
GPT-3 具有几个关键特性和功能,包括可用于广泛的语言相关任务,包括翻译、摘要和文本生成,这使其成为可应用于各种应用的多功能模型。
chatGPT 和 GPT-3 的区别是什么?
GPT-3 和 chatGPT 之间的主要区别在于它们的范围和目的。
- GPT-3 是一种大型通用语言模型,可以处理各种语言处理任务。
- 另一方面,ChatGPT 是一个较小的专用模型,专为聊天应用程序设计。虽然这两种模型都基于相同的底层技术,但 chatGPT 是根据会话语言处理的特定需求量身定制的。
Stable Diffusion 和 Midjourney 的区别?
什么是 Stable Diffusion?
Stable Diffusion 是一个文转图的模型,其使用了 CLIP ViT-L/14 文本编码器,能够通过文本提示调整模型。它在运行时将成像过程分离成"扩散(diffusion)"的过程--从有噪声的情况开始,逐渐改善图像,直到完全没有噪声,逐步接近所提供的文本描述。
什么是 Midjourney?
Midjourney 也是一款由人工智能驱动的工具,其能够根据用户的提示生成图像,Midlourney 善于适应实际的艺术风格,创造出用户想要的任何效果组合的图像。它擅长环境效果,特别是幻想和科幻场景,看起来就像游戏的艺术效果。
Stable Diffusion 和 Midjourney 之间的比较
Midjourney 是一个以其艺术风格闻名的工具。
Midjourney 使用其 Discord 机器人来发送以及接收对 AI 服务器的请求,几乎所有的事情都发生在 Discord 上。
由此产生的图像很少看起来像照片,似乎更像一幅画。
Stable Diffusion 是一个开源的模型,人人都可以使用。
它对当代艺术图像有比较好的理解,可以产生充满细节的艺术作品。
然而它需要对复杂的 prompt 进行解释。
Stable Diffusion 比较适合生成复杂的、有创意的插图。但在创作一般的图像时就显得存在些许不足。
下面的 prompt 有助于了解每种模型的相似性和差异。
A cartoon cat playing football (一只卡通猫咪踢足球)
这个是我作为一只“铲屎官”,看到自家猫咪喜欢玩球之类的,玩的挺好的,有种踢足球的感觉,所以希望有组织能做这么一个主题的动漫!
Midjourney 效果
Stable Diffusion
我们可以看到针对同一句 prompt 生成的图像有较大的差异,Midjourney 的画面充满艺术性,像一幅完整的动漫画作,而 Stable Diffusion 生成的图像更像是一张逗我玩的涂鸦。
不同的 prompt 生成出的图像也有巨大的差别,希望大家,可以继续探索学习驯化模型,运用平台生成更精美的图像。
认识 Midjourney 的 Prompt
如何使用 Midjourney 做出更好效果的图片?
Prompt 是 Midjourney 中一个非常重要的概念,它类似于一句指令或灵感,用于指导 AI 生成特定主题或视觉风格的图片。
在 Midjourney 中,用户可以通过输入自定义的 Prompt,让 AI 生成不同的图像。Prompt 不仅仅是文本,还可以使用图片以及各种参数,Midiourney 会使用AI 算法分析并理解输入的信息,所以熟练运用 Prompt 非常重要。
简单 Prompt
一个简单的 Prompt 可以只有一串文本,甚至只有一个单词就可以,用来告诉 AI 你想画什么。
比如:漫画 一个电竞少女,带着粉色的耳机,坐在电脑桌前,一台电脑放在桌上,游戏画面,浅灰色的长发,蓬松的头发,可爱,淡淡的腮红,空旷的房间,床上有几盆花朵,丁达尔效应
然后 AI 生成了下面这种风格的的4张图片:
关于 Prompt 的几个 Tips:
- 描述尽量具体:如果你有确定的图片需求,描述词尽可能具体,以获得更符合预期的结果,否则出来的效果与你想的可能大相径庭,不过如果你只是想探索一番,可以不用那么具体以获得更丰富多样的图片,有时会出现一些意外和惊喜。
- 只描述你想要的:只描述你想要的内容,而不是说你不想要的。
- 不断尝试和调整:在使用 Midjourney 时,需要不断尝试不同的Prompt,并根据结果进行调整和优化。可以从颜色、构图、细节、参数等多方面入手,对 Prompt 进行微调,以获得更好的创作效果,几乎不可能一两次就能立即获得满意的图片。
打开 MidJourney 官网,目前已经开放公测,所有用户均可使用
chatGPT 的原理及作用?
大概了解了 chatGPT 的基本理念,它的全称是 Generative Pre-trained Transformer,生成式预训练转换器。
简单来说,它的原理是:
先给它提供一个庞大的语料库(通常是直接从互联网上抓来的),让模型通过上千亿个参数对这些文本进行打散标记、学习,构建起一个复杂的预测模型。
然后再依据这个预测模型,判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来,形成一段话,或者一篇文章。
这种预测的模式,其实跟我们大脑的学习和加工模式是非常相似的。
因此,这也是它能够更“像人”的一个重要原因。
三层模型理解
这个模型背后无需人工参与的“无监督”式预训练自学习原理,或者说让模型像大脑“自由生长"的过程,就是它的动力层。
借由这个原理所完成的 GPT-3.5,就是一个结构层,是 ChatGPT 起作用的主要基础。
而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT,就是一个交互层,它的本质就是加了一层更友好的用户界面和交互方式,让个人用户能够更容易地应用它。
了解完 ChatGPT 的原理,我们自然会关心一个问题:就目前而言,ChatGPT 究竟能做什么?
chatGPT的作用
1.回答问题
这可能是 ChatGPT 最简单的应用。你在聊天界面里向它提问,比如“波粒二象性是什么意思”,它就会用流畅的语言向你解释,把这个概念讲解得非常清楚。就我试用的体验而言,效果非常好,简洁晓畅,表达能力胜过许多人。
2.撰写文章
你可以向它提要求,让它按照你的要求撰写一篇文章。例如:
3.撰写邮件
4.撰写策划方案
你可以给它一个主题,再给一些背景和指引,甚至让它帮你想创意、提供各种不同方向的点子和灵感。
5.撰写报告
你可以给它一些数据,让它根据这些材料撰写一份报告。等等。
总之,ChatGPT 具备极强的总结提炼信息的能力,但是 AI 只是帮我们拓展触及信息的能力,处理信息和做出决策的人依然是我们自己。而不是依赖于它给出的解释和答案,让它替代我们去决策和判断。一旦我们放弃了思考,我们作为人类的主体性其实也就不复存在。
拓展
除了现在最常见的:
- 内容生产 CoPilot(ChatGPT、Midjourney),
还有:
- 办公 CoPilot(微软 Office CoPilot)、
- 搜索 CoPilot(微软 New bing)、
- 编程 CoPilot(微软 GitHub CoPilot)、
- 教育 CoPilot(可汗学院、Speak、多邻国),
- 以及基于 ChatGPT Plugins 的接入了多个插件的生活服务 CoPilot。
其实还有更多,万物都可以 +GPT,万物都可以 CoPilot。
感受
人工智能带给我的感受:
一个人的认知,是需要不断的进化的,而进化主要靠和其他人的交流,获取到更多新的信息和他人的认知,然后认真学习吸收,从而迭代自己的认知。
一个人能力提升的速度,基本取决于他能链接到的信息的强度,和自己迭代的速度。
再说直白点,只要你能找到可以学习的牛人,你自己也愿意走出舒适区,愿意持续学习和思考,你就能进步,否则就是停滞不前,甚至被时代淘汰。
AI 进化的原理,其实和人脑是完全一样的,从机器学习,到深度学习,再到现在的pre-train 自监督大模型 + 生成式 AI,AI 越来越逼近人脑的机制。
AI 它也能帮助我们学习成长,帮助我们找学习资料,帮助我们解决疑难问题......就看怎么利用,会用不会用 AI,首先最重要的就是学会精准的表达,把你的需求精准的告诉 AI,它才能更好的帮助你。