Imagen 3支持人物生成，人人可用！谷歌Gemini AI重大升级来了时隔 5 个月，Imagen 3 终于可以人人

【新智元导读】时隔 5 个月，Imagen 3 终于可以人人可用了，而且还能支持是生成人物图像。与此同时，谷歌宣布了 Gemini AI 的重大升级，全新 AI 定制助手 Gems 已经面向 150 多个国家推出。

Gemini AI 平台又双叒升级了。

这次，谷歌直接给配上了 Gems 助手，还有最新图像生成模型 Imagen 3！

这当中，最让人兴奋的便是，Imagen 3 可以人人用上了。

网友们早已急不可耐，纷纷上手开启了测试。

Imagen 3 支持人物生成了

5 月的 I/O 开发者大会上，谷歌首次对外亮相了 Imagen 3 图像生成的能力。

此后几个月时间，这个 AI 生图工具一直在测试中。

正如当时博文所述，Imagen 3 可以根据文本提示，创建出更高质量的图像。

另外，Imagen 3 设定了图像质量的新标准，只需几个单词就能生成图像。

你甚至可以要求 Gemini 创作各种风格的图像，比如照片上的写实风景画、纹理油画，或者是异想天开的泥土场景。

值得注意的是，谷歌再次引入了生成人类图像的照片。此前，因 AI 生图人物带上了有色眼镜，谷歌便被全网攻击。

为了解决人们对深度造假、错误信息的担忧，谷歌已采取了安全措施，比如水印 SynthID。

升级后的模型，外媒 Ars 测试后发现，当让 AI 生成拜登打篮球的图像时，会被拒绝请求。

而当你请求「美国总统打篮球」，便可以得到更多的请求选择。

另外，在一些快速测试中，Imagen 3 还避免了生成「历史上不准确」的种族陷阱。

比如，让它生成一副英国国王肖像，AI 会生成穿着一袭红色长袍，留着胡须的白人，而不是以往种族多元化战士的组合。

如下是生成教皇的照片，可以看出整体非常稳定。

以往的生图效果是下面这样的，左右性别不一致，而且样貌多样。

现在，当你再让 Imagen 3 去描绘历史场景，便会违反谷歌的人工智能的规则。

然而，谷歌 Gemini 此前毫不避讳地生成出了，穿着纳粹风格衣服的亚洲人、黑人。

有人测试后，感觉 Imagen 3 整体效果不错，不过仍有很长的路要走。

定制 AI 助手 Gems

专门化的人工智能助手 Gems 支持 Gemini Advanced，企业、以及商业用户，面向 150 多个国家。

现在，任何一个人可以通过 Gems，为特定任务训练一个「数字专家」。

它可以是编码导师，也可以是营销策略师等等。

谷歌希望，这类面向定特任务的 AI 助手，能够解决像 GPT-4o 这样通用语言模型的局限性。

因为通过专门数据训练 / 定制的专业助手，能够提供更加实用、更高效的解决方案。

AI 巨头激战正酣，谷歌毫不示弱

过去一年里，包括 OpenAI、微软、Meta、Anthropic、HuggingFace 等在内的公司，都推出了可定制的 AI 聊天机器人平台。

这标志着整个行业，向个性化 AI 体验转变。

OpenAI 的 GPT Store 于 1 月推出之后，开发者们可以创建和分享 ChatGPT 的定制版本。

微软的 Copilot Studio，可以让企业能够开发定制的 AI 助手，而 Meta 的 AI Studio 是为了创建定制聊天机器人。

Anthropic 展示了 Claude 自动化任务的能力，HuggingFace 为定制 GPT 提供了一个开源的解决方案。

此时，Gems 和 Imagen 3 的发布，似乎是谷歌试图追赶，甚至赶超竞争对手的一次尝试。

一直以来，谷歌是 AI 研究领域的先驱，但在面向消费者的 AI 产品推向市场方面，有时会落后于对手。

特别是，在别家早已发布自定义助手之后，谷歌才有所行动。

从科幻到现实：AI 重塑世界

话又说回来，不论是谁家发布，这一新功能可能会对整个行业，产生深远的影响。

在教育领域，AI 导师可能会提供个性化学习体验；在医疗保健中，专门的 AI 助手能诊断和治疗规划。

在企业中，可以使用定制 AI 工具简化运营。

另一方面，AI 的进步也引发了关于数据隐私、工作替代、潜在滥用的问题。

尽管谷歌采取了一些强有力的安保措施，但 AI 发展的步伐已经超过了监管框架。

随着 AI 继续深入日常生活，谷歌 Gemini AI 可能会激发出这项技术的变革潜力。

参考资料：

venturebeat.com/ai/googles-…

arstechnica.com/ai/2024/08/…

blog.google/products/ge…

Imagen 3支持人物生成，人人可用！谷歌Gemini AI重大升级来了

**【新智元导读】**时隔 5 个月，Imagen 3 终于可以人人可用了，而且还能支持是生成人物图像。与此同时，谷歌宣布了 Gemini AI 的重大升级，全新 AI 定制助手 Gems 已经面向 150 多个国家推出。

从科幻到现实：AI 重塑世界

【新智元导读】时隔 5 个月，Imagen 3 终于可以人人可用了，而且还能支持是生成人物图像。与此同时，谷歌宣布了 Gemini AI 的重大升级，全新 AI 定制助手 Gems 已经面向 150 多个国家推出。