ChatGPT用不了?收下这份求生路线图;OpenAI闭门讨论会V3纪要.pdf(下载);AI稳定生成图工业链路打造 | ShowMeAI日报

4,633 阅读12分钟

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

img

🤖 『OpenAI闭门讨论会V3【GPT-4】纪要.pdf』内部专业解读,研判GPT-4后的技术与商业格局

img

最近有一份非常优质的内部资料在社群内小范围传播,是海外的业内人士对 OpenAI、ChatGPT、GPT-4、大模型的思考,以及对未来技术、商业、创业、机遇的研究预判。很专业,质量也很高,值得一读!

OpenAI闭门讨论会V3【GPT-4】纪要.pdf》是2023年3月19日,海外独角兽在社群内组织的 OpenAI 闭门讨论会的纪要,共45页,详细记录了围绕 GPT-4 的思考和观点交锋。具体问题包括:

Q1:GPT-4 之后,如何看模型能力演变和边界。

Q2:AI Native Apps :如何思考 AI native 和 LLM 应用的前景?AI-native Apps,最终会呈现什么形态?未来看好哪些垂直应用?

Q3:大模型的未来格局:可能是多寡头格局,并且中美之间应该分开讨论 OpenAI 一家独大,还是多寡头战场?

Q4:垂直场景是否有训练自己模型的必要性?

点击 🌍PDF 获取原文

🤖 『OpenAI闭门讨论会纪要V2.pdf』跟着大佬才看懂,真的要天翻地覆了

img

OpenAI闭门讨论会纪要V2.pdf》与上一份资料同属一个闭门讨论会系列。这份报告的时间更靠前,是2023年3月5日,共27页,讨论的话题更为广阔和宏观,分享了对 OpenAI 这轮技术革新对垂直领域、商业模式和商业化的深刻洞察。讨论的20个问题包括:

Q1:OpenAI 接下来会有哪些动作?

Q2:ChatGPT 被广泛应用之后输入的数据是否会对模型的走向有影响?

Q3:OpenAI 现在用了多少算力,之后会需要多少算力?

Q4:数据方向的新应用场景。

Q5:OpenAI 的开源与制衡问题。

Q6:通用和垂直哪个更有盈利能力?

Q7:哪些垂直领域有创业机会?

Q8:垂直领域如金融/医疗如何做?

Q9:目前软件公司有哪些经营模式?

Q10:ChatGPT 对于垂直应用层有哪些影响?如何节省下大模型训练的成本?

Q11:垂直领域的数据如何处理?

Q12:应用领域二分法。

Q13:数字化发展的不同商业模式,三个极端:1)传统企业;2)互联网企业,例如抖音和字节,通过一个引擎来驱动整个商业模式变现; 3)滴滴、美团,非常强的人机互动。

Q14:从哪些维度能有效评估大模型?OpenAI 内部的评估手段?

Q15:OpenAI infra 搭建过程中有哪些关键点、milestone 、难点、重要性都是什么?

Q16:大模型的数据处理质量如何保障?OpenAI 团队内部怎么做的?在垂直细分领域,比如医疗行业,数据需求量是否足够大?

Q17:OpenAI 闭源模型和 Stability 开源模型的未来发展路径。

Q18:对比 PC → Mobile 的特征变化,LLM 带来了哪些本质变化?

Q19:OpenAI 能赚百亿美元营收大钱的商业化业务会是什么?

Q20:微软对 OpenAI 的加分项和减分项

点击 🌍PDF 获取原文

img

🤖 『OpenAI ChatGPT Plugins』在 ChatGPT 进入公众视野之前,OpenAI 早就为开发者准备好了 API

img

2023年 (北京时间)3月24凌晨,OpenAI 宣布 ChatGPT 中初步实现对插件的支持。插件专门为大语言模型设计,以安全为核心原则,能够帮助 ChatGPT 访问最新的信息运行计算以及使用第三方服务

也就是说,OpenAI 插件会将 ChatGPT 直接连接到第三方应用程序。插件能够使 ChatGPT 参与开发者定义的API互动,增强 ChatGPT 的能力,使其能够执行各类广泛场景的任务。

ChatGPT 与 Bing 聊天机器人并不是产品的终极形态。ChatGPT和Bing,其实属于一种应用层面的展示,主要是强调这种基于GPT模型,如果做成应用工具,到底能有多么先进。 而正是这种演示效应,和在公众、企业、科研机构中造成的影响,导致生成式AI领域的军备竞争帷幕,徐徐展开。(🌍@阿法兔研究笔记)

“OpenAI 设计的插件系统,是我这辈子见过的最疯狂的系统。如果你要给它写一个插件,并不是去写这个插件程序,而是用自然语言写一个关于插件的描述,然后 GPT 来帮你生成这个插件。”

🤖 『百度李彦宏』不要重复造轮子,AI的十倍机会在别处

img

过去一周,AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天,OpenAI 发布了新一代 GPT-4 大模型;后一天又有微软发布搭载最新 GPT-4 的AI助手 Copilot ——均是震撼业界的产品进展。百度文心一言随之成为激烈争论的对象。

带着人们围绕文心一言的诸多质疑,36氪独家访问了百度创始人兼CEO李彦宏,用15个非常尖锐的问题直接发文,李彦宏的回答则非常真诚。

直接点击 🌍@36氪 阅读采访原文。

🤖 『Canva』发布10项 AI 能力,与 Adobe 直接对决!

img

2023年3月23日,🌍Canva 发布了自己的一系列 AI 能力,一共10个功能:

  1. Magic Design:借助 Magic Design,您现在只需上传图像、选择样式,即可在精选的个性化和完全可自定义模板中观看它栩栩如生,以便下载或进一步编辑。

  2. Draw your Ideas:我们很高兴发布一种新的方式来绘制任何类型的设计。另外,如果您需要帮助,我们会神奇地识别您正在创建的内容并平滑形状。

  3. Translate Designs:创建设计后,您需要与世界分享。借助我们全新的翻译功能,您可以比以往更轻松地进行跨境交流,并使用受众的语言。

  4. Magic Eraser and Magic Edit:使用魔术橡皮擦,您可以在眨眼间神奇地消除不必要的干扰。

  5. Beat Sync:只需选择或上传您要使用的音乐曲目,然后只需单击一下,Beat Sync 即可将您的素材与配乐的节拍完美对齐。

  6. Magic Presentations:跳过空白页,生成下一个Canva演示文稿的初稿,其中包含大纲、幻灯片和内容。只需用几句话给 Magic Design 您的想法,然后看着它立即直观地在具有专业外观的幻灯片中填充您的故事。

  7. More Magic Write:根据你的要求,快速生产营销文案,并填充到设计内容。

  8. We’ve evolved Text to Image:文本到图像可让您在几秒钟内从简单的描述中创建独特的图像。

  9. Animations:只需绘制您希望动画采用的路径,沿途加快或减慢速度,然后就会自动生成路径动画。

  10. Brand Hub:Canva的新品牌中心 带来了团队在Canva的编辑体验中创建品牌设计所需的所有成分。您的品牌模板、品牌指南、字体、图形、徽标、项目等将在一个地方提供,因此任何人都可以快速创建品牌。

img

🤖 『ChatGPT 用不了咋办?』送你一份求生路线图!

img

🧰 路线1:用 OpenAI 的 API Playground。

platform.openai.com/playground?…

🧰 路线2:用 OpenAI 的 API,不想编程就找个现成的界面,比如 Typingmind,填上 key 就能用。

www.typingmind.com/

🧰 路线3:用 Poe 里面的 ChatGPT (其实也是 OpenAI 的 API)。

poe.com/chatgpt

🧰 路线4:New Bing (GPT-4),之前 🌍日报 里也给出过完整的教程。

注册一个新账号,以下方式不用等

  • 科学节点挂全局选日本,香港节点不行,美国节点可能需要等待。
  • 用Chrome打开无痕模式,打开 bing.com/new
  • 在日本节点下注册新账号,新账号默认归属日本
  • 注册成功加入waitlist,不用审核直接可以通过。 (微博@UNCLE疯叔)

申请通过后,下载 🌍Edge dev,并且安装 🌍HeaderEditor 插件,设置插件参数,就可以使用了。

详细的操作与安装教程,见这篇文章 🌍新必应 (New Bing)国内申请与使用教程

当然,要是 ChatGPT 彻底崩了,上面这几个也一样用不了,可以试试 Poe 里的其他 Bot,也能凑活用~

img

🤖 『怎么判断一个UI设计师会不会被AI替代?』设计师使用手册

img

🌍Twitter@倪爽 是超过 20 年经验资深设计师,为中美各种公司提供过设计顾问服务。倪爽认为,老板和员工都可以用一个很简单的方法,来判断要不要拿 AI 替代 UI 设计师。

第一步:设计开始前,介绍设计思路。回答我觉得、how to、what,思路都是模仿市场现有设计,最容易被 AI 替代。而回答围绕 why 是人类设计师难以替代的优势。

一个脑子里懵懵懂懂有几十个破碎、模糊的参考对象的人,肯定比不上熟练掌握几十万个参考案例、随时能把不同风格无缝融合的 AI 设计工具。

以设计一个音频播放器的 UI 为例

  1. 一堆前言不搭后语的“我觉得”,凭直觉做设计,基本上就是把最近看过的几个播放器设计加上自己喜欢的设计风格,凑一个缝合怪。

  2. 描述 how to,“我打算用扁平化设计,按钮放在右下角”。常见于有经验的 UI 设计师,这表示 ta 凭经验、凭直觉做设计,或者说 ta 做播放器设计很久了,通常拿大厂设计、竞品设计作为自己的设计模式/设计参考模板

  3. 描述 what,“我会做一个金属质感+全息图质感的 web3 风格,播放按钮按下去发出渐变的红光”。常见于平面设计转岗的 UI 设计师,ta 追求的是视觉效果,通常是以市面流行的设计风格作为设计模式/设计参考模板。

  4. 描述 why,“我们用户年轻女性为主,所以用可爱二次元风格设计播放器,这样可以增加友好度,让用户愿意长时间使用播放器”。这些围绕 why 的设计思路,不管它是关注用户喜好、还是用创意在产品和用户之间建立情感连接,都是 AI 不擅长的,都是人类设计师难以替代的优势。

第二步,设计完成后,再说明设计思路,对比前后的变化。多数 UI 设计师在完成设计之后,想法变化不大,做完设计也想不明白 why。

这些设计师在和 AI 竞争中也很容易被替代,因为他们缺乏学习能力、思考能力,难以从以往经历中抽象出经验。

这个判断方法不但适合设计主管、设计总监这些设计管理者,也适合不懂设计的普通领导、普通老板。当然 UI 设计师也可以快速自行判断

只要做到这三点,设计师不用太担心被 AI 取代:清晰的设计思路,有能力用数据、调研和项目经验来支持自己的设计决定,知道自己所在公司或行业人、资源和商业的关系。

img

🤖 『AI稳定生成图,工业链路打造』优质好文!如何控制文本生成图片的质量

img

全文从以下三个层次介绍了如何控制图片生成

  1. 该如何工业化地、稳定地设计我们的生产工艺和链路
  2. 围绕生产工艺和链路,该配备哪些生产组件和部件,配合我们强大生产引擎组合出牛逼生产系统
  3. 该如何设置好参数,让我们生成引擎达到产出图质量稳定,性能优良

全文从以下5个层次,介绍如何控制整个图片生成过程,以确保稳定地生成高质量的图片:前4个部分带大家了解控制文本生成图的框架和内部工序,最后一部分介绍“控制文本生成图片”的实现步骤。

生产引擎 stablediffusion:图片生成系统核心部件

  • (1) 图片输入。包括图片 (随机噪声、约束图片)、图片编码 (vae encode)
  • (2) 文字输入。又涉及描述文字 (prompt优化)、文字编码 (clip)
  • (3) 生成模型。即把图编码、文编码作为原料,塞进不同生成模型中
  • (4) 输出部分。经过生成模型输出最终效果图,可以是单步或多步生成图

生产集成车间 stablediffusion_webui:实现各种模块自由组合

  • (1) image2image
  • (2) lora

影响生产引擎的其他工序:通过影响数据或特征生成等方式辅助生产引擎,使得生产引擎能发挥更大作用

  • (1) Embedding
  • (2) Text Inversion
  • (3) Dreambooth
  • (4) VAE

网络结构:网络结构是生产引擎的内部网络,其架构影响图片最终生成效果

  • (1) Hypernetworks
  • (2) 网络merge fix
  • (3) 分层融合

生成链路

  • (1) instruct pix2pix
  • (2) Lora

实现工序步骤

  • (1) 图片输入前置处理工序—图片打标
  • (2) 图片生成后处期工序 (图片质量打分、图片修改)

🌍CSDN@远洋之帆

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!