这AI二维码也太酷炫了!谷歌生成式AI学习路径;媒体的AI炒作套路报告;使用GPT-4自动化制作短视频 | ShowMeAI日报

3,843 阅读8分钟

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🤖 新鲜出炉!2023人工智能10大分类排行榜

这是根据2023年6月德本咨询、eNet研究院和互联网周刊联调的人工智能排行榜,包含以下主题的10个榜单,可以帮助选择梦想高校、就业企业等。

AI领域高校

年度AIGC企业

AI芯片企业

自动驾驶企业

智能家居企业

人工智能算法企业

人脸识别算法企业

人工智能平台企业

AI数据生产企业

AI服务器企业 ⋙ @优设

🤖 RecurrentGPT:目前数一数二的AI小说写作模型 (社区亲测)

苏黎世联邦理工学院 (ETH) 和 WaveAI 研究人员发布了 RecurrentGPT,一种新型 AI 语言模型,可用于小说等交互式长篇内容创作。在ShowMeAI社区测试中,通过简单的要素补全,RecurrentGPT 就可以生成有趣和连贯的剧情 (包含中文),风格包含科幻、浪漫、幻想、恐怖、神秘等等。

RecurrentGPT 使用自然语言模拟 RNN / LSTM 的循环计算,克服了传统基于 Transformer 的模型长度限制。该模型使用自然语言提示引导和调节内容生成过程,使用户能够生成有趣且连贯的长篇内容。

在线 Demo

长篇小说写作www.aiwaves.org/recurrentgp…

交互式小说:www.aiwaves.org/interactive… ⋙ 论文地址 | GitHub 开源地址

🤖 谷歌发布AI绘图工具 StyleDrop,既有创造力又更可控

最近,谷歌研究团队推出了AI绘图工具 StyleDrop,既具有创造力的同时,风格又更可控,风头将要盖过 Midjourney。

StyleDrop 能够捕捉各种样式的纹理、阴影和结构的细微差别,只需要一张图作为参考,无论多么复杂的艺术风格都能解构再复刻,能够更好地控制图片生成的风格,生成内容也会更贴近设计师的需求 ⋙ 论文地址 | GitHub 地址

🤖 王慧文融资16亿,光年之外成为大模型独角兽

美团联合创始人王慧文的AI创业公司光年之外,已在近期完成了新一轮 2.3 亿美元(折合人民币 16.3 亿,具体金额以官方为准)融资,投前估值 10 亿美元,进场百天,晋升独角兽。

光年之外的本轮融资,据称由源码资本领投,押注 8000 万美元,此外腾讯、五源资本和快手创始人宿华均参与其中 ⋙ @量子位

🤖 使用 GPT-4 自动化批量制作 YouTube 短视频

现在很多创作者宣称自己使用AI制作了短视频,但仔细观察就可以发现其中每个步骤都有手动操作的环节。为了实现全流程的自动化,文章作者 @VICODE78 在 Riddit 分享了自己使用 GPT-4 完成任务的工作流。

1. 创建脚本,自动调用GPT-4 API来编写短视频脚本

2. 使用文本到语音eLeven Lab API,将脚本文字生成为逼真的语音

3. 创建脚本将生成的音频转换为SRT文件以提取字幕,并将字幕提供给 GPT-4

4. GPT-4 为每一幅插图生成提示词和时间戳

5. 将所有插入进行编辑,并添加字幕,完成类似视频渲染的步骤

完成工作流的开发后,使用时只需输入一个视频主题并点击鼠标,就可以在5分钟内收获一个酷炫的短视频!作者即将在GitHub开源这个项目,一起期待下 ⋙ @Reddit

🤖 Stable Diffusion + QR Code = ?这样的二维码也太酷炫了!

这样的图片是怎么制作的呢?简单来说,先使用 Stable Diffusion 生成风格化图像,再通过添加三个定位点,将这些图像转化为可以扫描识别的二维码。

这个项目/产品名为「ControlNet for QR Code」。作者在文档中分享了训练和推理过程,并在Google TPU v4的加持下快速完成了300万张图的训练。

这个项目的成果包括各种风格的可识别二维码,如中国传统纹样、浮世绘风格、二次元和插画风格、水墨风格、水彩风格、立体风格等。项目即将开源,一起期待下!

1. 开始之前

2. Stable Diffution 图像生成

3. Stable Diffusion 模型训练

4. Stable Diffusion 工作流程展示

5. Midjourney 图像生成

6. NeRF

7. LLM 文字生成

8. NeRF

9. AIGC Pipeline 工具 ⋙ @Isle of Chaos | 开发文档

🤖 过去六个月里,媒体是如何炒作 ChatGPT 的?

在过去半年多的时间里,媒体对AI的报道呈爆发式增长趋势,不少新闻记者都在绞尽脑汁进行报道。Jem Bartholomew 和 Dhrumil Mehta 采访了大量的记者与学者,并对 2022 年 11 月至 2023 年 5 月中旬AI相关报道进行了统计分析。

新闻媒体是如何报道生成式AI与ChatGPT的?这其中有哪些以下是核心观点,完整报告请看原文:

1. 记者绞尽脑汁想获取吸引力,会使用夸张的标题,甚至内容会危言耸听

2. 22年11月最后一天,OpenAI推出ChatGPT并引发关注,但指导23年2月才真正破圈,成为全社会关注的技术突破

3. 媒体报道往往被公司的表述所引导,这也使得各大公司CEO在社交媒体活跃并积极发表主张,不过这是一个系统性问题

4. 新闻编辑需要更慎重地评估和选择,哪些人的评论是有价值的、值得报道的、有新闻价值的、可以解决问题的

5. 作者总结了新技术的新闻炒作周期:新技术首先会带来各类承诺与期待 → 然后媒体报道会分化为两个极端,行业终结者 VS 技术乌托邦,推高讨论热潮 → 最后开始细致地讨论技术实际影响,进入冷却周期 ⋙ @Columbia Journalism Review.

🤖 Google 生成式AI学习路径,10门课专为初学者设计

扫描上方二维码,查看社区学习笔记打卡!

Google 刚刚发布「Generative AI learning path」,是专为初学者设计的免费学习路径,一共包含10门独立课程。

这个系列从基础概念开始,逐步深入到更复杂的主题,帮助初学者理解生成式AI的基础知识,以及如何在Google Cloud 上创建和部署生成式 AI 解决方案,并解决实际问题。

1. 生成式AI简介〖Introduction to Generative AI〗

入门级课程,解释了生成式 AI 是什么,如何使用,以及与传统机器学习方法有何不同,涵盖了 Google 工具,以帮助你开发自己的生成式 AI

2. 大型语言模型简介〖Introduction to Large Language Models〗

入门级课程,探讨了大语言模型是什么,可以在哪些用例中使用,以及如何调整提示来提高 LLM 的性能,涵盖了 Google 工具

3. 负责任的AI简介〖Introduction to Responsible AI〗

入门级课程,解释了什么是负责任的 AI,它为什么很重要,以及 Google 如何在其产品中实施负责任的 AI,还介绍了 Google 的7个 AI 原则

4. 图像生成简介〖Introduction to Image Generation〗

入门级课程,主要介绍了扩散模型从物理学、特别是热力学中汲取灵感,并在过去几年中成为研究热点

5. 编码器-解码器结构〖Encoder-Decoder Architecture〗

中级课程,编码器-解码器架构是一种强大且常见的机器学习架构,用于序列到序列的任务,如机器翻译、文本摘要和问题回答

6. 注意力机制〖Attention Mechanism〗

中级课程,介绍注意力机制的工作原理和优化措施,注意力机制是一种强大的技术,允许神经网络专注于输入序列的特定部分

7. Transformer模型 和BERT模型〖Transformer Models and BERT Model〗

入门级课程,介绍了 Transformer 架构和 BERT 模型,包括Transformer的主要组成部分以及构建方式

8. 创建图像描述模型〖Create Image Captioning Models〗

中级课程,介绍如何使用深度学习创建图像描述模型,包括图像描述模型的不同组成部分 (如编码器和解码器),以及如何训练和评估

9. 生成式AI Studio简介〖Introduction to Generative AI Studio〗

入门级课程,Generative AI Studio 是 Vertex AI 产品之一,帮助实现生成式AI模型的原型化和定制化,课程介绍了 Generative AI Studio 的原理与操作步骤

10. 生成式AI探索〖Generative AI Explorer - Vertex AI〗

入门级课程,Vertex Quest 是关于如何在 Google Cloud 上使用生成式 AI 的系列实验,用以了解如何使用 Vertex AI PaLM API 家族中的模型 ⋙ Google课程链接 | ShowMeAI社区课程笔记打卡

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!