ChatGPT用不了？收下这份求生路线图；OpenAI闭门讨论会V3纪要.pdf(下载)；AI稳定生成图工业链路打造

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦！

🤖 『OpenAI闭门讨论会V3【GPT-4】纪要.pdf』内部专业解读，研判GPT-4后的技术与商业格局

最近有一份非常优质的内部资料在社群内小范围传播，是海外的业内人士对 OpenAI、ChatGPT、GPT-4、大模型的思考，以及对未来技术、商业、创业、机遇的研究预判。很专业，质量也很高，值得一读！

《OpenAI闭门讨论会V3【GPT-4】纪要.pdf》是2023年3月19日，海外独角兽在社群内组织的 OpenAI 闭门讨论会的纪要，共45页，详细记录了围绕 GPT-4 的思考和观点交锋。具体问题包括：

Q1：GPT-4 之后，如何看模型能力演变和边界。

Q2：AI Native Apps ：如何思考 AI native 和 LLM 应用的前景？AI-native Apps，最终会呈现什么形态？未来看好哪些垂直应用？

Q3：大模型的未来格局：可能是多寡头格局，并且中美之间应该分开讨论 OpenAI 一家独大，还是多寡头战场？

Q4：垂直场景是否有训练自己模型的必要性？

点击 🌍PDF 获取原文

🤖 『OpenAI闭门讨论会纪要V2.pdf』跟着大佬才看懂，真的要天翻地覆了

《OpenAI闭门讨论会纪要V2.pdf》与上一份资料同属一个闭门讨论会系列。这份报告的时间更靠前，是2023年3月5日，共27页，讨论的话题更为广阔和宏观，分享了对 OpenAI 这轮技术革新对垂直领域、商业模式和商业化的深刻洞察。讨论的20个问题包括：

Q1：OpenAI 接下来会有哪些动作？

Q2：ChatGPT 被广泛应用之后输入的数据是否会对模型的走向有影响？

Q3：OpenAI 现在用了多少算力，之后会需要多少算力？

Q4：数据方向的新应用场景。

Q5：OpenAI 的开源与制衡问题。

Q6：通用和垂直哪个更有盈利能力？

Q7：哪些垂直领域有创业机会？

Q8：垂直领域如金融/医疗如何做？

Q9：目前软件公司有哪些经营模式？

Q10：ChatGPT 对于垂直应用层有哪些影响？如何节省下大模型训练的成本？

Q11：垂直领域的数据如何处理？

Q12：应用领域二分法。

Q13：数字化发展的不同商业模式，三个极端：1)传统企业；2)互联网企业，例如抖音和字节，通过一个引擎来驱动整个商业模式变现； 3)滴滴、美团，非常强的人机互动。

Q14：从哪些维度能有效评估大模型？OpenAI 内部的评估手段？

Q15：OpenAI infra 搭建过程中有哪些关键点、milestone 、难点、重要性都是什么？

Q16：大模型的数据处理质量如何保障？OpenAI 团队内部怎么做的？在垂直细分领域，比如医疗行业，数据需求量是否足够大？

Q17：OpenAI 闭源模型和 Stability 开源模型的未来发展路径。

Q18：对比 PC → Mobile 的特征变化，LLM 带来了哪些本质变化？

Q19：OpenAI 能赚百亿美元营收大钱的商业化业务会是什么？

Q20：微软对 OpenAI 的加分项和减分项

点击 🌍PDF 获取原文

🤖 『OpenAI ChatGPT Plugins』在 ChatGPT 进入公众视野之前，OpenAI 早就为开发者准备好了 API

2023年 (北京时间)3月24凌晨，OpenAI 宣布 ChatGPT 中初步实现对插件的支持。插件专门为大语言模型设计，以安全为核心原则，能够帮助 ChatGPT 访问最新的信息，运行计算以及使用第三方服务。

也就是说，OpenAI 插件会将 ChatGPT 直接连接到第三方应用程序。插件能够使 ChatGPT 参与开发者定义的API互动，增强 ChatGPT 的能力，使其能够执行各类广泛场景的任务。

ChatGPT 与 Bing 聊天机器人并不是产品的终极形态。ChatGPT和Bing，其实属于一种应用层面的展示，主要是强调这种基于GPT模型，如果做成应用工具，到底能有多么先进。 而正是这种演示效应，和在公众、企业、科研机构中造成的影响，导致生成式AI领域的军备竞争帷幕，徐徐展开。(🌍@阿法兔研究笔记)

“OpenAI 设计的插件系统，是我这辈子见过的最疯狂的系统。如果你要给它写一个插件，并不是去写这个插件程序，而是用自然语言写一个关于插件的描述，然后 GPT 来帮你生成这个插件。”

🤖 『百度李彦宏』不要重复造轮子，AI的十倍机会在别处

过去一周，AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天，OpenAI 发布了新一代 GPT-4 大模型；后一天又有微软发布搭载最新 GPT-4 的AI助手 Copilot ——均是震撼业界的产品进展。百度文心一言随之成为激烈争论的对象。

带着人们围绕文心一言的诸多质疑，36氪独家访问了百度创始人兼CEO李彦宏，用15个非常尖锐的问题直接发文，李彦宏的回答则非常真诚。

直接点击 🌍@36氪 阅读采访原文。

🤖 『Canva』发布10项 AI 能力，与 Adobe 直接对决！

2023年3月23日，🌍Canva 发布了自己的一系列 AI 能力，一共10个功能：

Magic Design：借助 Magic Design，您现在只需上传图像、选择样式，即可在精选的个性化和完全可自定义模板中观看它栩栩如生，以便下载或进一步编辑。
Draw your Ideas：我们很高兴发布一种新的方式来绘制任何类型的设计。另外，如果您需要帮助，我们会神奇地识别您正在创建的内容并平滑形状。
Translate Designs：创建设计后，您需要与世界分享。借助我们全新的翻译功能，您可以比以往更轻松地进行跨境交流，并使用受众的语言。
Magic Eraser and Magic Edit：使用魔术橡皮擦，您可以在眨眼间神奇地消除不必要的干扰。
Beat Sync：只需选择或上传您要使用的音乐曲目，然后只需单击一下，Beat Sync 即可将您的素材与配乐的节拍完美对齐。
Magic Presentations：跳过空白页，生成下一个Canva演示文稿的初稿，其中包含大纲、幻灯片和内容。只需用几句话给 Magic Design 您的想法，然后看着它立即直观地在具有专业外观的幻灯片中填充您的故事。
More Magic Write：根据你的要求，快速生产营销文案，并填充到设计内容。
We’ve evolved Text to Image：文本到图像可让您在几秒钟内从简单的描述中创建独特的图像。
Animations：只需绘制您希望动画采用的路径，沿途加快或减慢速度，然后就会自动生成路径动画。
Brand Hub：Canva的新品牌中心带来了团队在Canva的编辑体验中创建品牌设计所需的所有成分。您的品牌模板、品牌指南、字体、图形、徽标、项目等将在一个地方提供，因此任何人都可以快速创建品牌。

🤖 『ChatGPT 用不了咋办？』送你一份求生路线图！

🧰 路线1：用 OpenAI 的 API Playground。

platform.openai.com/playground?…

🧰 路线2：用 OpenAI 的 API，不想编程就找个现成的界面，比如 Typingmind，填上 key 就能用。

www.typingmind.com/

🧰 路线3：用 Poe 里面的 ChatGPT (其实也是 OpenAI 的 API)。

poe.com/chatgpt

🧰 路线4：New Bing (GPT-4)，之前 🌍日报里也给出过完整的教程。

注册一个新账号，以下方式不用等

科学节点挂全局选日本，香港节点不行，美国节点可能需要等待。

用Chrome打开无痕模式，打开 bing.com/new

在日本节点下注册新账号，新账号默认归属日本

注册成功加入waitlist，不用审核直接可以通过。 (微博@UNCLE疯叔)

申请通过后，下载 🌍Edge dev，并且安装 🌍HeaderEditor 插件，设置插件参数，就可以使用了。

详细的操作与安装教程，见这篇文章 🌍新必应 (New Bing)国内申请与使用教程。

当然，要是 ChatGPT 彻底崩了，上面这几个也一样用不了，可以试试 Poe 里的其他 Bot，也能凑活用~

🤖 『怎么判断一个UI设计师会不会被AI替代？』设计师使用手册

🌍Twitter@倪爽 是超过 20 年经验资深设计师，为中美各种公司提供过设计顾问服务。倪爽认为，老板和员工都可以用一个很简单的方法，来判断要不要拿 AI 替代 UI 设计师。

第一步：设计开始前，介绍设计思路。回答我觉得、how to、what，思路都是模仿市场现有设计，最容易被 AI 替代。而回答围绕 why 是人类设计师难以替代的优势。

一个脑子里懵懵懂懂有几十个破碎、模糊的参考对象的人，肯定比不上熟练掌握几十万个参考案例、随时能把不同风格无缝融合的 AI 设计工具。

以设计一个音频播放器的 UI 为例

一堆前言不搭后语的“我觉得”，凭直觉做设计，基本上就是把最近看过的几个播放器设计加上自己喜欢的设计风格，凑一个缝合怪。

描述 how to，“我打算用扁平化设计，按钮放在右下角”。常见于有经验的 UI 设计师，这表示 ta 凭经验、凭直觉做设计，或者说 ta 做播放器设计很久了，通常拿大厂设计、竞品设计作为自己的设计模式/设计参考模板

描述 what，“我会做一个金属质感+全息图质感的 web3 风格，播放按钮按下去发出渐变的红光”。常见于平面设计转岗的 UI 设计师，ta 追求的是视觉效果，通常是以市面流行的设计风格作为设计模式/设计参考模板。

描述 why，“我们用户年轻女性为主，所以用可爱二次元风格设计播放器，这样可以增加友好度，让用户愿意长时间使用播放器”。这些围绕 why 的设计思路，不管它是关注用户喜好、还是用创意在产品和用户之间建立情感连接，都是 AI 不擅长的，都是人类设计师难以替代的优势。

第二步，设计完成后，再说明设计思路，对比前后的变化。多数 UI 设计师在完成设计之后，想法变化不大，做完设计也想不明白 why。

这些设计师在和 AI 竞争中也很容易被替代，因为他们缺乏学习能力、思考能力，难以从以往经历中抽象出经验。

这个判断方法不但适合设计主管、设计总监这些设计管理者，也适合不懂设计的普通领导、普通老板。当然 UI 设计师也可以快速自行判断。

只要做到这三点，设计师不用太担心被 AI 取代：清晰的设计思路，有能力用数据、调研和项目经验来支持自己的设计决定，知道自己所在公司或行业人、资源和商业的关系。

🤖 『AI稳定生成图，工业链路打造』优质好文！如何控制文本生成图片的质量

全文从以下三个层次介绍了如何控制图片生成：

该如何工业化地、稳定地设计我们的生产工艺和链路
围绕生产工艺和链路，该配备哪些生产组件和部件，配合我们强大生产引擎组合出牛逼生产系统
该如何设置好参数，让我们生成引擎达到产出图质量稳定，性能优良

全文从以下5个层次，介绍如何控制整个图片生成过程，以确保稳定地生成高质量的图片：前4个部分带大家了解控制文本生成图的框架和内部工序，最后一部分介绍“控制文本生成图片”的实现步骤。

生产引擎 stablediffusion：图片生成系统核心部件

(1) 图片输入。包括图片 (随机噪声、约束图片)、图片编码 (vae encode)
(2) 文字输入。又涉及描述文字 (prompt优化)、文字编码 (clip)
(3) 生成模型。即把图编码、文编码作为原料，塞进不同生成模型中
(4) 输出部分。经过生成模型输出最终效果图，可以是单步或多步生成图

生产集成车间 stablediffusion_webui：实现各种模块自由组合

(1) image2image
(2) lora

影响生产引擎的其他工序：通过影响数据或特征生成等方式辅助生产引擎，使得生产引擎能发挥更大作用

(1) Embedding
(2) Text Inversion
(3) Dreambooth
(4) VAE

网络结构：网络结构是生产引擎的内部网络，其架构影响图片最终生成效果

(1) Hypernetworks
(2) 网络merge fix
(3) 分层融合

生成链路

(1) instruct pix2pix
(2) Lora

实现工序步骤

(1) 图片输入前置处理工序—图片打标
(2) 图片生成后处期工序 (图片质量打分、图片修改)

🌍CSDN@远洋之帆

◉ 点击 👀日报&周刊合集，订阅话题 #ShowMeAI日报，一览AI领域发展前沿，抓住最新发展机会！

◉ 点击 🎡生产力工具与行业应用大全，一起在信息浪潮里扑腾起来吧！

ChatGPT用不了？收下这份求生路线图；OpenAI闭门讨论会V3纪要.pdf(下载)；AI稳定生成图工业链路打造 | ShowMeAI日报