Notebook LM :万物皆可生成播客

154 阅读2分钟

大神 Andrej Karpathy 在社交平台强烈推荐了谷歌的 NotebookLM, 并认为其 AI 播客生成的功能触及了一个全新的领域,是极具吸引力的 LLM 产品形式。 让他不禁想起 ChatGPT 出圈时的感觉。

但其实 Notebook LM 并不是一款最近推出的新产品,而是早在 2023 年就已经上线了。它这次出圈主要是因为上线了一个新功能:将任何形式的文本内容转换为 AI 播客。

换句话说,你的读书笔记、网课视频、甚至信用卡账单都能变成播客。

我上传了一个招聘的 JD, 选择「音频概览」:

wechat.png

几分钟后便得到一个 4 分钟的播客:

image.png

我本以为是枯燥的 JD 复述,但得到的结果居然有点惊艳。两位主持人围绕着这份 Tiktok 招聘 JD 展开对话,非常自然,毫无 AI 痕迹。还调侃了下 Tiktok 公司和业务。

音频见:notebooklm

还有用户上传了自己的信用卡账单的 PDF 文件,结果 AI 吐出了一个 7分钟的播客,讲述了用户在 Uber 上有多败家,并感到羞耻。

NotebookLM新功能.png

当然,对于许多听众来说,播客的学习方式可能更为有效。将论文或课程笔记上传,做成一个播客,在空闲时间听听这些播客,就可以轻轻松松完成学习任务。

看完上面这些例子,大家应该能够初步感受到 notebookLM 的厉害之处了,它这种 「万物皆可播客」的能力,是一种与ChatGPT 文本对话形式完全不同的交互方式。

为什么播客这个新的交互形式会被认为具有极大的潜力?

回归开篇 Andrej Karpathy 的观点,他在社交平台上也解释了为什么他认为 NotebookLM 是下一个 ChatGPT。

他认为LLM的能力(智力、记忆长度、支持多模态等)已经远远超前于如何通过UI/UX打包为产品。比如代码解释器、Claude Artifacts、Cursor/Replit、NotebookLM 等。这也是他认为双人对话播客格式作为UI/UX探索如此吸引人的原因。

它突破了使用LLM的两个主要“享受障碍”。

首先,聊天是困难的。你不知道该说什么或问什么。在双人播客的格式中,提问由AI负责,所以生成过程变得更加轻松,不再有同步交流的压力。

其次,阅读是困难的,而只需靠着听则轻松得多。与生啃晦涩的书本相比,在开车或者跑步时听听别人的讨论更加的容易。NotebookLM 将庞大的文本内容,视频内容转换成音频的形式,满足了更多用户的使用场景。

参考链接:

[1]notebooklm.google/

[2]x.com/karpathy/st…

如果喜欢我的内容,可以关注下公众号呦:

QR Code for GH A1FE0BC4153D.jpg