AI浏览器Dia:聊天式UI与网页未来

123 阅读6分钟

Dia是一款新型AI浏览器,允许用户与网页内容聊天互动,提供信息查询、内容质疑和购物推荐等功能。它代表了Web浏览方式的潜在变革,未来AI可能深度整合到浏览器中,甚至出现由AI驱动的超级应用程序。

译自:AI Browsers: Dia’s Chat-Based UI and the Future of the Web

作者:Richard MacManus

网页浏览器已经作为 Web 的核心应用存在了三十多年。从根本上说,它在这段时间里并没有太大的变化,但现在它开始被重新构想为一个 AI 工具。Dia,一款邀请你“与你的标签聊天”的新型网络浏览器,刚刚由 The Browser Company 以邀请制测试版的形式发布。我试用了一下,看看 AI 浏览器能提供什么。

目前,Dia 具有相当基础的 AI 功能——它会打开一个聊天框,你可以在其中查询网页的内容,或者获得推荐(例如在电子商务网站上购物时)。

Dia 欢迎界面

Dia 欢迎界面。

如果你是一名开发人员,你可能想使用 Dia 来查询 Stack Overflow 等网站上的内容。在这个例子中,我突出显示了一个我想获得更多上下文的短语,并收到了有用的聊天回复。

Dia 上的 Stack Overflow

Dia 上的 Stack Overflow。

我还发现,当你想要了解更多关于某个特定网页上没有涵盖的信息时,Dia 很有用。以我自己的互联网历史网站 Cybercultural 为例,我询问 Dia 1990 年代的 PointCast 公司究竟发生了什么,因为这篇文章中没有涵盖这一点。Dia 给了我一个令人满意的答复。

在 Dia 中询问更多上下文

在 Dia 中询问更多上下文。

现在,作为页面作者,我为自己辩护一下,我实际上已经链接到一篇关于 PointCast 倒闭的文章,因为我觉得它超出了我的文章范围。所以用户只需点击一下就能获得这些信息,这就引出了一个问题:Dia 会损害网站运营商的链接推荐吗?这个问题不仅仅是关于 Dia,它也是网络发布商在 Google AI OverviewsPerplexity 和其他 AI 搜索产品 方面的一个巨大担忧。

除了让 AI 聊天机器人提供更多上下文之外,你还可以质疑——也许审问是一个更好的词——网页上的信息。再次以 Cybercultural 为例,我质疑文章中关于微软在 1990 年代对 DHTML 的愿景比 Netscape 更具创新性的说法。Dia 回复说(谢天谢地)该页面是正确的,并解释了原因。

在 Dia 上挑战网站的内容

在 Dia 上挑战网站的内容。

Dia 还可以做一些漂亮的推荐工作,这在像 ChatGPT 这样的 AI 聊天产品中也很常见。Dia 在其主页上给出的一个例子是,要求聊天机器人找到比电子商务网页上显示的毛巾更便宜的毛巾。Dia 目前没有 AI 代理技术 来帮你购买更便宜的毛巾,但人们可以想象这种功能会在某个时候到来。

Dia 购物

Dia 购物示例。

浏览 Web 的方式正在改变

正如你所看到的,Dia 提供的功能在 AI 功能方面仍然非常基础——它没有做任何 ChatGPT 已经可以做的事情。也就是说,这确实让人感觉是我们将来使用浏览器方式的一个重大改变。能够查询网页,从互联网的其他部分获取更多信息来扩充网页,以及(最终,人们推测)让 AI 代理在后台为你执行基于该网页内容的操作——这些都改变了“网页浏览”的范式。

在过去的 30 多年里,我们拥有的 Web 浏览器的主要功能是将人们从一个网站或 Web 应用程序带到另一个网站或 Web 应用程序。有时,浏览器扩展(或插件)会扩展网站的功能,但这不是典型的用例。对于绝大多数人来说,浏览器只是帮助你从一个网站冲浪到另一个网站——或者如果你是 Z 世代,浏览器就是当你点击原生应用程序中的链接时打开的那个窗口。

你现在不仅仅是在浏览 Web,你还会与它交谈。

当然,这些年来浏览器已经有了技术上的增强。值得注意的是,当 Google Chrome 在 2008 年 9 月推出时,它有一个多进程模型,其中每个选项卡、插件和扩展都可以在其自己的沙盒进程中运行。但除了浏览器变得更好更快之外,核心功能仍然相同:浏览 Web。

然而,AI 浏览器可能会从根本上改变 Web 浏览器的用途。你现在不仅仅是在浏览 Web,你还会与它交谈。不仅如此,最终 AI 浏览器可能会为你做很多浏览工作——很可能在几年内,我们将能够访问 AI 代理,它们将为你执行 Web 上的各种操作,很可能通过使用像 Dia 这样的浏览器或像 Playwright 这样的无头浏览器。

浏览器的未来

Dia 现在提供的只是冰山一角。一些开发人员一直在深入思考 Web 浏览器的功能如何因 AI 而改变。Paul Kinlan 对浏览器略知一二:他是 Google 的 Web 和 Chrome 开发人员关系负责人。Kinlan 最近开设了一个名为 AI Focus 的个人博客,他在其中探索“AI 如何改变 Web 和 Web 开发的媒介”。

在一篇文章中,他思考了 AI 技术如何导致“超级应用程序”——类似于中国的微信。从本质上讲,他假设在不久的将来,你可以从 LLM 或聊天机器人的提示中获得动态生成的 UI。他说,Web 技术可以为这些新的用户界面提供动力:

“HTML、CSS 和 JavaScript 是当今可用的最具表现力的 UI 渲染语言,而 LLM 今天非常擅长生成它们,因此在我看来,存在一个世界,这将是在其中一个 LLM 中直接构建 UI 以满足用户请求的特定需求的最简单途径,而且你几乎不需要离开。”

我们是否正走向超级应用程序而不是独立的 Web 浏览器?

这对作为独立产品的 Web 浏览器来说听起来不太好,但请记住,智能手机应用程序已经使用 WebView 在应用程序内打开链接——实际上是将浏览器嵌入到应用程序中。因此,Kinlan 的“超级应用程序”想法是对此的延伸。

Kinlan 以这个问题结束了这篇文章:“谁还需要浏览器?”

当然,Dia 希望自己成为一个超级应用程序。至于 Google,它可能会很快将 Chrome 升级为“AI 浏览器”,而像 OpenAI 和 Perplexity 这样的 AI 公司可能会发布他们自己的浏览器产品(事实上,Perplexity 已经在 开发一个浏览器,而且有传言称 OpenAI 也在开发)。

我们还不知道,比如说,五年后浏览 Web 会是什么样子。如果让我猜测,我会说 Google 和 OpenAI 都将在五年内为消费者提供领先的、基于代理和聊天的 AI 浏览器产品。无论如何,我可以肯定的是:AI 浏览器将给 Web 浏览带来根本性的变化;而 Dia 则让我们看到了这个未来的一瞥。