博尔赫斯、超文本、Web

457 阅读10分钟

小径分岔的花园

《小径分岔的花园》是阿根廷作家博尔赫斯的短篇小说,小说中描绘了一座名叫“小径分岔的花园”的无限迷宫,这座迷宫周而复始、循环不已,可以从开头通往结尾,也可以从结尾通往开头。一开始人们以为这座迷宫是一座实际被建造出来,隐藏在某个秘密角落的建筑,但小说中的汉学家发现,这座迷宫其实是一部小说。在传统的小说中,故事的发展通常是线性的,每当小说主角遇到选择时,总是会进入其中一个选择,并排除其他选择。但在“小径分叉的花园”中,故事的发展是非线性的,主角可以选择所有的选择,不同的选择会产生不同的情节分支,分支之中又可以产生分支,有时无限延伸,有时交叉又分离,形成一个无限的迷宫。在每一个选择中都会出现一个角色,在选择的分支中推进剧情,这些角色同时存在于不同的小径之上,很像我们现在提到的“多重宇宙”的概念。

54462609_861316127555792_3779872705709342720_o.jpeg

博尔赫斯与《小径分叉的花园》

多重宇宙的概念现下很多人都耳熟能详,最近的《妈的多重宇宙》《奇异博士2:疯狂多元宇宙》等作品都有类似的设定。但在 1941 年这还属于非常先锋的概念,也因为这篇文章中的概念,博尔赫斯被称为“超文本”的启蒙人。

《妈的多重宇宙》

Vannerva Bush 和 Memex

博尔赫斯发布这篇文章后的 1945 年,美国科学家Vannerva Bush 在文章“As We May Think” 中描述了一种设备——可以压缩和存储个人所有书籍、记录、通信名叫“Memex” 的设备,Memex 代表的意思是 Memory Extend。在 Bush 的想象中,这部设备由机电控制、微缩胶卷、阅读器、一张大桌子组合而成,桌子下面藏着微缩胶卷。当人在微缩胶卷上阅读或者写入内容时,光电管会读取记录在单个微缩胶卷帧旁的编码符号,通过桌子右边的“键盘”可以访问链接,访问时微缩胶卷会高速旋转,带我们去往对应编码符号的文档。编码符号使 Memex 记录下来的内容可以索引、搜索、连接其他文档,达到创建和跟踪关联文档的目的。Bush 所设想的设备外观看起来很像我们现在所使用的 PC,而这一套文档联想轨迹系统,就是超文本的最初的原型。

Vannerva Bush

Memex

Ted Nelson 和 Hypertext

1961 年 Ted Nelson 开发了可以用于创建和浏览链接内容的模型,他称之为 Hypertext 和 Hypermedia,Hyper 是全面、延伸的意思,而 Hypermedia 是超文本的延伸。Ted Nelson 所构想的超文本系统是双向连接的,每个节点都知道与它连接的其他节点是什么,可以完整的保留内容的上下文。Ted Nelson 的构想更像人脑的记忆联想,在联想时,我们可以通过一个记忆的节点,联想到另外一个节点,并且可以从这个节点往上回溯且不会丢失上下文。而单向链接带来的问题是——链接的丢失(404)、不断扩展的链接、无法追踪来源的引用、没有版本管理、没有权限管理。Ted 为了实现自己构想的超文本系统,把大部分的时间都投入到了一个名为 Project Xanadu 的项目中,但是直到 2014 年,这个项目的交付雏形才出现。

Ted Nelson

Project Xanadu 发布版

超文本系统

计算机出现以后,人类对文字的处理越来越简单,生产的文字资料也越来越多。在大型的研究项目中,资料文档可能有数十万,并且这些资料文档都是为了同一个项目服务的,想要方便的访问这些资料,只能通过分类和索引的方式来优化,但是这远远不够,当我们在一个资料文档中看到脚注和索引时,我们并不能立马打开被索引的文档,而是又需要返回到巨大的资料库中去查找,如果可以直接通过索引找到对应的文档,那么在资料的阅读会变得非常连贯,也更符合人类的思考方式——联想。

那有没有一种方式可以实现这种需求?首先我们需要一个编辑器,来让电子文档具备这样的功能。在这个编辑器中,我们可以让电子文档的文字被索引,同时附加上地址属性,当文字被触发时,就可以进入到被索引的文档。而有了一个这样的编辑器,还需要一个浏览器来浏览这样的文档,在浏览这些具备超文本能力的文档时,遇到超链接时,要如何对超链接进入访问呢?是通过键盘挪动到对应的超文本位置上,然后点击某个按键进行访问吗?为了方便,科学家制造了光电笔,通过光电笔可以便捷地访问超链接,直达另外一个文档。这就是超文本系统的雏形,一开始只是用于私人的资料整理。

早期的超文本系统

70、80 年代期间出现了很多超文本系统、设备,80 年代初期还出现了许多实验性质的超文本和超媒体程序,其中的许多功能和术语后来被集成到了 Web 中,但在这个阶段超文本系统仅仅作为个人的资料存储库而存在。

Apple 公司发布的超文本系统产品 HyperCard

Web

直到 80 年代后期 Tim Berners Lee(后简称 Tim) 发明了 World Wide Web(后简称 Web)。Web 源自于 Tim 参与的大型项目 CREN,这个项目的参与人数上万,生产出来的资料更是数十万计,Tim 为了解决这个问题,开发了一个叫做 ENQUIRE 的工具,用来满足 CERN 和世界各地不同大学、研究所工作的物理学家对即时信息共享的需求,这个工具很像 wiki 早期的超文本数据库系统。

image.png

The birth of the Web

早期的 World Wide Web 界面

同时期,Ted Nelson 正痴迷于他的 Xanadu 项目,直到 Web 被发明出来都没有发布过任何产品。而 Web 因为其强大的扩展性,迅速在互联网上扩散,从 1993 年的 500 个 Web 服务器,激增到 1994 年的 10000 多个。但实际上在 Web 出现之前,已经出现了很多超文本系统,而 Web 做的只是将这些必要的功能保留下来了而已。

设想一下,在 Web 出现之前,超文本系统只用于个人资料存储,链接的范围比较有限。但在 Internet 上,需要让所有 Web 用户可以任意链接到其他用户的文档,要如何做到这一点呢?首先 Tim 抛弃了传统的超文本系统的双向连接,采用了单向连接来设计 Web,这也导致了我们经常会在网页上发现很多死链(404),以及我们没有办法不通过历史记录的情况下从下一个文档中回到上一个文档。但单向链接的好处,是用户不需要知道自己链接的是什么,甚至可以出现文档还没有,但是链接已经存在的情况,而这种方式具有极大的扩展性。

PC 是独立的孤岛,互联网将这些孤岛链接了起来,而为了能让用户可以互相链接文档,就需要基于互联网网络协议发明一种传输协议,用来传输超文本文档,这样才能通过链接来进行跳转。而这种协议就是 HTTP(Hypertext transfer protocol),通过 HTTP 用户就可以互相链接和传送文档了。

但是 Web 用户文档存储在独立的服务器上,当用户传输时,根本不知道自己传的是什么,所以需要有一种标识,来标记用户服务器的资源,并且这种标记在互联网上是唯一的。而这种标识就是 URI(Unify Resource Identifyer),使用 URI 标志的资源,Web 用户在设置的链接被访问时,超文本浏览器才可以准确地找到文件的位置,并展示给用户。

Web 中的电子文档为了尽可能的还原和扩展纸质文本,需要让电子文本具备排版格式,因此 Tim 开发了HTML(Hyper Text Markup Language)。Markup language 是一种将文本以及文本相关的其他信息结合起来的语言,Markup language 最早用于出版行业,是作者、编辑以及出版商之前用于描述出版作品的排版格式所使用的。通过 HTML 可以让电子文档具备纸质文档出版时同样的排版格式,这样就相当于将纸质文档搬到了电脑上。

URI、HTTP、HTML 组成了 Web1.0,被应用于互联网,这也是为什么,我们会把浏览器叫做浏览器,因为最早的超文本系统的就是由编辑器、浏览器、导航工具组成。

AJAX  的出现,让 Web 进入了 2.0,这个阶段的 Web 交互性变得更强大了。

而据 Tim 本人所说,Semantic Web 会是 Web3.0 的关键要素,语义网技术规范在很早就开始制定了,但是一直没有大规模应用起来。

在 Tim 的构想中,语义网可以让机器理解所有文档的信息,那么其实我们就不需要中心化的搜索引擎了,我们需要的是一个智能主机,而语义网会结成一个巨大的分布式数据库,尤其是在区块链技术和 AI 逐渐成熟的情况下。

结语

在整理超文本资料的过程中,我发现了 Ted Nelson 的 Project Xanadu 的发布版本——xanadu.com/xanademos/M…

“With our limited resources we can only go slowly, unlike today's Red Bull-fueled young teams.Though our ideas have been pushed out of the way, they are still good.We expect vindication, and eventual acceptance as a fundamental document type and format that will stand tall against the paper imitations.No one else is pursuing this approach; everyone is hypnotized by the Web browser, which is basically crippled for these purposes.”(谷歌翻译:由于我们资源有限,我们只能慢慢来,不像今天红牛推动的年轻球队。尽管我们的想法被排除在外,但它们仍然是好的。我们期望得到辩护,并最终接受作为一种基本的文档类型和格式,将与纸质模仿相抗衡。没有其他人在追求这种方法。每个人都被 Web 浏览器催眠了,它基本上是为了这些目的而瘫痪的。)