【AI手记系列】2026.05.26 一周AI小结

0 阅读3分钟

前言:关于 AI 手记系列

这会是一个新的周更系列,记录一周下来所阅读的AI相关文章、掌握的AI使用技巧、以及在工作和业余实践中积累下来的AI经验。

本文记录以下3篇公众号文章的阅读和思考

Android Show | I/O Edition 2026

这次核心还是聚焦 Gemini 深度整合、跨设备 AI 体验、新硬件 Googlebook,以及 Android Auto 和 Android 17 的相关升级,不出意外,都是在主打“agentic AI”。

image.png

Gemini Intelligence

在系统层面进行AI的打通和整合,智能手机行业一直缺少这样一个东西,前两年的豆包手机尝试做这件事,但字节毕竟只是应用厂商,缺少系统层面更加深度的定制,难以解决不同应用之间 数据孤岛 的问题。

国内 华米OV 几家头部厂商,都在尝试做这件事,就看谁落地得又快又好了。一旦做成,相信带来的影响不亚于功能机到智能机的变革。

Googlebook

Google缺少做硬件产品的基因,这次也不例外,单纯营销软件概念,无法撼动桌面市场。

Android 17 新功能

PausePoint 有点意思,说明Google也关注到了手机带来的一些负面效果,但科技是无法改变人性的,你 Google 有防沉迷,我各个短视频大厂的产品经理们自然有办法吃掉用户更多时间,道高一尺,魔高一丈。

制造豆包:一个 AI 超级入口的形成与转向

image.png

SWOT 来分析豆包手机助手:

  • 优势:C端用户规模领先,且用户画像(年轻,接受新事物,分享欲强)极易于破圈传播;依托字节APP工厂
  • 劣势:模型能力非第一梯队,容易犯错;偏娱乐场景,非长期持续用户,付费意愿低;AI反规模成本
  • 机会:继续豆包手机,营造超级入口;嵌入电商(不看好)
  • 威胁:模型能力掉队,算力压力(字节有巨大现金流,不慌)

这篇文章中关于 Musical.ly 的一些讲述,勾起了自己十年前的回忆。当时刚准备离开DP,由于Musical.ly当时技术负责人张木喜曾经是DP的架构师,自己便去参加了这家公司的面试,还记得办公室很小,并且是在老厂房一楼昏暗的房间里。种种原因自己没有加入,阴差阳错吧。

如何把 Codex 用到极致

这是针对 Mac Codex App 的文章,虽然我日常用的是 wsl 中的 Codex CLI,文中大部分功能也在 Codex CLI 找到对应的特性。

  • 持久对话流:对应 codex resume,现在已经有自动压缩上下文,对于重要的记忆,仍建议人工方式慎重管理。
  • 语音输入:很需要,CLI 有没有替代品?
  • 任务干预与排队: CLI 里面的 EscQueue
  • 工具与触达范围:最近两周用的最多的就是 playwright,简直好用到爆炸!
  • 随时随地工作:有用,Android 版本的 APP 已支持,但在桌面端只有 Mac 版本的 Codex APP 才支持。根据 OpenAI 的说法,Windows 版本正在 coming soon...
  • 定时自动化执行:这不就是 crontab
  • Goals:好东西,用起来。