谷歌 I/O 2025 开发者大会内容总结
下面是今年的谷歌I/O上发布的所有产品和更新,主要聚焦AI方向大发力:
-
Gemini 2.5 模型更新
- Gemini 2.5:Google 的最新 AI 模型系列,具有更强的智能和推理能力。
- Deep Think:为 Gemini 2.5 Pro 引入的实验性增强推理模式,能够处理更复杂的任务。
- 模型性能提升:通过改进训练方法和架构优化,Gemini 2.5 在语言理解、生成和多模态任务中表现出色。
- 安全性增强:发布了关于 Gemini 2.5 安全保障的白皮书,强调其在防止滥用和保护用户隐私方面的改进。
-
Gemini 应用更新
- Gemini 应用:引入了 Veo 3 和 Imagen 4,分别用于视频生成和图像生成。
- Deep Research:为 Gemini 应用增加了深度研究功能,帮助用户更高效地进行学术研究。
- Canvas:新的创意工具,允许用户通过 AI 生成艺术作品。
-
AI 在搜索中的应用
- AI Mode:Google 搜索引入了 AI 模式,利用 Gemini 2.5 模型提供更智能的搜索结果。
- AI Overviews:在搜索结果中提供更全面的总结和分析,帮助用户快速获取信息。
-
AI 在购物中的应用
- 虚拟试穿:Google 购物引入了 AI 模式,用户可以通过 AI 生成的虚拟试穿功能,看到自己穿上衣服的效果。
- 个性化推荐:利用 AI 提供更个性化的购物建议。
-
AI 在创意领域的应用
- Flow:与 Veo 3 结合的 AI 制片工具,帮助创作者制作高质量的视频内容。
- Generative Media Models:推出新的生成式媒体模型,如 Imagen 4 和 Veo 3,支持用户生成高质量的图像和视频。
-
开发工具更新
- Gemini Code Assist:为开发者提供更强大的代码辅助工具,支持个人开发者和 GitHub 用户。
- Jules:Google 的自主编码代理,现在进入公开测试阶段,帮助开发者更高效地编写代码。
-
其他更新
- Google AI Ultra:新的 AI 订阅服务,提供对最先进模型的高级访问和高级功能。
- Android XR:展示了 Android XR 如何将 Gemini 带到眼镜和头显设备上。
- Google Beam:Project Starline 正式更名为 Google Beam,利用 AI 将 2D 视频流转换为沉浸式视频通话。
佬们可以在官方博客[1]找到所有内容的更详细的介绍。
微软 Microsoft Build 2025 大会重点总结
微软在 Microsoft Build 2025 开发者大会[2]上重磅发布了一系列 AI 更新。以下是几个值得关注的重点更新:
- Windows AI Foundry:在本地设备上支持模型选择、优化和部署。
- Azure AI Foundry:支持包括 Flux、Sora、Llama 等更先进的模型,提供自动化模型选择和性能监控。
- GitHub Copilot:重构到 VSCode 的核心代码中并开源
- Edge 浏览器:内置AI API供开发者和浏览器扩展使用;内置 PDF 翻译功能。
完整内容还是看官方新闻集
腾讯混元 Game:工业级 AIGC 游戏制作引擎发布
腾讯混元 AI 最新推出的 Hunyuan Game[3]是一款工业级 AIGC 游戏制作引擎。它支持从草图生成角色/场景原画、文本/手绘生成特效、材质风格迁移等基础功能,还能实现角色多视角生成 3D 模型、生成动态立绘,甚至构建可交互的 3D 世界。