用SD完美还原金庸小说名场面;产品经理用ChatGPT提效520倍;盘点13个SD最强模型;中国移动推出周杰伦数智人 | ShowMeAI日报

4,619 阅读7分钟

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🤖 『ChatGPT访问量再创新高』强势挑战谷歌、百度的霸主地位

SimilarWeb 的统计数据显示,ChatGPT 在4月份的全球访问量已经达到17.6 亿次,在搜索引擎中排名第4,挡在前面的只剩下Google、中国的百度、俄罗斯的Yandex。

整个4月,ChatGPT主域名的访问量,已经达到Google约2%、百度约60%,的确给传统搜索引擎平台带来了极大的挑战。

不过,ChatGPT自身的高速增长,在4月出现了放缓的迹象,只有12.6% ,而此前3个月的增长速度分别为131.6%、62.5%、55.8% ⋙ SimilarWeb统计详情

🤖 『周杰伦与中国移动开启元宇宙合作』推出数智人「周同学」

5月8日,周杰伦亮相厦门的中国移动咪咕元宇宙总部,与中国移动共同推出了数智人「周同学」,并将举办元宇宙演唱会。从官方视频来看,「周同学」的皮肤细节和服饰设计参照了周杰伦本人的个性风格,细节处理非常精致。

数智人「周同学」由好莱坞特效团队 WETA 维塔工作室打造,外形完美地1:1复刻了周杰伦本人,建模有着精细的质感和酷炫的人设,逼真且精致。发布会现场,周杰伦评价自己的数智人时说「我觉得他很酷,而且他永远都不会老」~ ⋙ 这里观看官方视频

🤖 『抖音关于人工智能生成内容的平台规范暨行业倡议』AI生成内容必须显著标识

人工智能技术的快速发展,为互联网内容创作领域带来了更多可能性,但同时也带来了虚假信息、侵权等问题。

抖音此次发布的规范,明确要求平台生态参与者在应用生成式人工智能技术时,需要进行明确标识,并通过实名认证等方式,避免侵权、造谣等内容。平台也将对人工智能生成内容衍生的问题进行治理,同时提供打标、虚拟人形象注册等技术支持,保护用户权益 ⋙ 官方发布与解读 | 全文

🤖 『产品经理如何用ChatGPT提效520倍』看到了PM岗位在未来的更多可能性

在过去的几个月里,随着大模型的陆续发布和AI工具的快速迭代,设计、研发、自媒体从业者开始感到自危,担心在AI洪流中自己会瞬间被取代。产品经理 @夏捞师 分享了使用 ChatGPT在实际工作中的代码优化测试及效果。

实际业务场景

选取了一段SQL查询代码,对应的业务需求是一个使用频次较高的日报

旧代码行数有近1900行,每天更新一次,每次的运行时长在一个多小时,而且只能查询最近一个月的日报数据,业务没法做历史数据的同环比分析

作为一名产品经理,我自己缺乏读写和优化这种超长SQL的能力。因此决定使用GPT,解决性能差历史数据存档的问题

测试效果非常完美

最终的SQL执行时间从4200秒缩短到8秒,效率提升了520倍,复杂度降低了6倍,同时还能保存所有的历史数据,报表可以秒开

完整的使用过程

Step1:旧代码输入

Step2:需求及现状问题输入

Step3:根据优化结果不断调试

Step4:实测新代码的正确性和效果 ⋙ 更详细的图文记录

🤖 『用Stable Difussion (SD) 完美还原了金庸小说场景』飞雪连天射白鹿,笑书神侠倚碧鸳,都可以安排了~

Reddit 用户@Blade2019Runner 最近分享了他是如何利用 Stable Diffusion 画出了《天龙八部》系列插画的过程。原帖和评论区非常精彩,以下是核心流程的简化表述:

利用 ControlNet 获取构图 → 「PS叠放素材 → SD局部重绘 (inpaint)→ PS叠放素材 → SD局部重绘 (inpaint) → ……」

1、 使用 Blender 绘制人物基础模型

这一步并不要求高超的建模技巧,使用的3D基础模型也可以在资源网站轻松获得,主要目的是为后续流程能更好地获取角色的动作。导入 Blender 后,为角色设定好造型并截图,就可以进入第2步。

2、使用 ContorlNet 获取构图

利用 Controlnet 的OpenPose、Canny、Depth三个应用模型,分别获得了姿势、线稿、景深,从而分别控制画面中的不同部分。

3、PS 素材叠放 和 SD局部重绘

将从互联网上找到的「与期望近似的素材」,利用PhotoShop贴在SD生成的图片上,将原图中不理想的元素覆盖,然后使用SD进行局部重绘。

2+3步反复进行,最终得到理想效果 ⋙ reddit 原帖 | 专业解读

🤖 『后GPT时代,多模态是最大的机会』未来的通用智能一定是多模态智能

王咏刚,SeedV实验室创始人/CEO,创新工场AI工程院执行院长,有着软件工程师、投资人和创业者等多重身份。本文是他的创业团队对跨文本、图像、视频、3D、动画序列等多模态AI领域的深度思考。以及,他近期在个人公众号中输出的观点,都非常值得一看。

文章核心观点:

1. 未来的通用智能一定是多模态智能

2. GPT-4代表的大语言模型具备某些多模态潜能

3. 多模态算法正处在「寒武纪大爆发」的早期

4. 多模态算法很可能再次收敛到某种「大力出奇迹」的超级大模型

5. 多模态是大模型科研与工程领域最好的弯道超车机会

6. GPT让AI平民化,应用开发者很难建立核心技术壁垒

7. 但在多模态领域,三至五年内仍有修建「技术护城河」的大量机会

8. 多模态领域的应用创新、模式创新机会远多于单模态领域

文章讨论的关键问题:

大语言模型的「垄断」与「白菜化」

多模态AI的广阔天地

多模态技术处于大爆发早期

多模态AI为什么这么难

大语言模型本身的多模态能力

另一个「大力出奇迹」的结局?

多模态应用的创新蓝海 ⋙ 全文

🤖 『AI绘图StableDiffusion最强大模型盘点』诸神乱战,这5个强势胜出

这么多的Stable Diffusion 大模型该怎么选?动辄几十个大模型的推荐文有点遭不住?看看这篇文章!作者结合自己玩遍Civitai、HF、Lora等等的经验,精挑细选了5个大模型,并附上推荐参数。足矣~

1. majicMIX(整体最好的真人大模型)

2. GhostMix(整体最好的2.5D大模型)

3. MIX-Pro(最通用的2D大模型)

4. 啥玩意完犊子(很有特点的复古画风大模型)

5. Night Sky(最华丽的2D大模型) ⋙ 原文

🤖 『AI绘图StableDiffusion最棒LoRA模型盘点』小样也能出奇迹,推荐8个心头好

大语言模型动不动几百B几千B,为了让大语言模型执行特定任务,直接把这几百B的大模型拿来微调的话,贵+慢+重,性价比太低。所以出现了LoRA这种方式,又便宜又快体积还小,体积可以整整小一千倍。还跟插件一样,即插即用。

LoRA模型就属于百花齐放了。因为精致小巧的特性,有无数的LoRA都能达到不错的效果,其中特定人物的LoRA模型最多。本文作者推荐了8个风格向的LoRA模型,人物模型可以根据自己喜好Civitai上查找。

1. Korean-doll-likeness

2. 墨心 MoXin

3. hanfu汉服

4. blindbox/大概是盲盒

5. Anime Tarot Card Art Style 塔罗牌

6. Gundam RX78-2 outfit style 高达RX78-2外观风格

7. M_Pixel 像素人人

8. The Legend of Zelda: Breath of the Wild Style(旷野之息)⋙ 原文

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!