AI与大模型深度理解指南:四本必读书籍,带你全面掌握核心知识

9 阅读4分钟

第一本《通用人工智能》

至少从 20 世纪 50 年代起,人们就开始大肆宣传可能很快就会创造出一种能够与人类智能的全部范围和水平相匹配的机器。现在,我们已经成功地创造出了能够解决特定问题的机器,其准确度达到甚至超过了人类,但我们仍然无法获得通用智能。

这本书想和大家探讨,还需要做什么样的努力才能不仅获得专用智能,还能获得通用智能。如果读者对智能感兴趣,想了解更多关于如何建造自主机器的知识,或者担心这些机器突然会以一种被称为“技术奇点”的方式统治世界,请阅读本书。

通过阅读本书,读者将会了解到:

  • 尽管人工智能已经变得越来越复杂而强大,但计算机科学还远未创造出通用人工智能 。

  • 人类自然智能的认知机理以及人工智能发展的初心与使命,从不同方面认知当前人工智能技术的不足。

  • 从当前“专用人工智能”到实现真正的“通用人工智能”还需要在哪些方面取得突破。

  • 机器智能的进步可能会改变人们从事的工作类型,但它们不会意味着人类存在的终结。

  • 为什么机器智能的改进并不会导致由机器所带来的失控性革命,机器智能的进步并不会导致世界末日的到来。

遗憾:本书英文版完成于 2022 年,遗漏了 2023 年 GPT 带来的巨变。

第二本《深度学习革命》

这是一本讲述人工智能,尤其是深度学习的历史与未来的书。在这本书中,作者讲述了一群将深度学习带给全世界的企业家和科学家的故事,从谷歌、Facebook、百度等大公司的决策者讲到学术界的领军人物——“深度学习三巨头”,再讲到 DeepMind、OpenAI 等知名实验室的开创者。

读者可以通过这些人的故事,跟随现代人工智能的发展脚步,从人工智能研究的萌芽阶段开始,穿过两次人工智能的寒冬,一直了解到当下全新的前沿进展。通过描绘人工智能的发展脉络和各大科技公司在前沿趋势方面的布局,这本书阐释了人工智能如何走到了今天,以及它在未来将如何发展。

第三本《科学之路》

“图灵奖”得主、“深度学习三巨头”之一、“卷积神经网络之父”……由于在人工智能领域的突出贡献,杨立昆被中国计算机科学界和企业界所熟知。

杨立昆的科学之路,谱写了一段关于勇气的宣言。他为了知识本身求学,而不是文凭,他用自己的经历,证明了通过激烈的考试竞争进入名校不是科学成功的窄门。他广泛阅读,为他科学思维的形成奠定了坚实的理论基础。他特立独行,做自己感兴趣的事情,即便那件事在短时间里不被人看好。在人工神经网络研究的低谷期,他寂寞地坚持,终于取得了举世瞩目的成就。

人工智能正在颠覆人类社会,未来机器能思考吗?杨立昆的这部著作,讲述正是人工智能在我们面前崛起——这个历史上仅有的时刻发生的故事。

《从零构建大模型》

如果你想知道 LLM 的“引擎盖”下面到底是什么,塞巴斯蒂安·拉施卡的这本《从零构建大模型》是个不错的选择。这本书最大的特点就是“从零开始”,它假设你只有 Python 基础,然后一步步带你构建一个类似 GPT-2 的模型。

书中涵盖了数据处理、分词、注意力机制、Transformer 架构实现、预训练、指令微调(包括 RLHF 的概念)等关键环节。作者是大模型领域的知名科普作家,擅长深入浅出地解释大模型的各种技术原理,也是知名 GitHub 项目 LLMs-from-scratch 的创建者,在“动手”这件事上很有经验。

读这本书,最大的收获不是得到一个多强的模型,而是通过实践,真正理解模型工作的内部机制和各个组件的作用。配套的 GitHub 代码和视频也很有价值。

资料下载方式

点击下载