算法简介

101 阅读6分钟

内容

  • 1.为阅读后续内容打下基础。
  • 2.编写第一种查找算法——二分查找。
  • 3.学习如何谈论算法的运行时间——大O表示法。
  • 4.了解一种常用的算法设计方法——递归。

1.1引言

算法是一组完成任务的指令。任何代码片段都可视为算法,但本书只介绍比较有趣的部分。 本书介绍的算法要么速度快,要么能解决有趣的问题,要么兼而有之。下面是书中一些重要内容。 第1章讨论二分查找,并演示算法如何能够提高代码的速度。在一个示例中,算法将需要 执行的步骤从40亿个减少到了32个! GPS设备使用图算法来计算前往目的地的最短路径,这将在第6、7和8章介绍。 你可使用动态规划来编写下国际跳棋的AI算法,这将在第9章讨论。 对于每种算法,本书都将首先进行描述并提供示例,再使用大O表示法讨论其运行时间,最 后探索它可以解决的其他问题。

1.1.1性能方面

好消息是,本书介绍的每种算法都很可能有使用你喜欢的语言编写的实现,因此你无需自己 动手编写每种算法的代码!但如果你不明白其优缺点,这些实现将毫无用处。在本书中,你将学习比较不同算法的优缺点:该使用合并排序算法还是快速排序算法,或者该使用数组还是链表。 仅仅改用不同的数据结构就可能让结果大不相同。

1.1.2问题解决技巧

你将学习至今都没有掌握的问题解决技巧,例如: 如果你喜欢开发电子游戏,可使用图算法编写跟踪用户的AI系统; 你将学习使用K最近邻算法编写推荐系统; 有些问题在有限的时间内是不可解的!书中讨论NP完全问题的部分将告诉你,如何识别 这样的问题以及如何设计找到近似答案的算法。

总而言之,读完本书后,你将熟悉一些使用最为广泛的算法。利用这些新学到的知识,你可 学习更具体的AI算法、数据库算法等,还可在工作中迎接更严峻的挑战。

需要具备的知识

要阅读本书,需要具备基本的代数知识。具体地说,给定函数f(x) = x × 2,f(5)的值是多 少呢?如果你的答案为10,那就够了。 另外,如果你熟悉一门编程语言,本章(以及本书)将更容易理解。本书的示例都是使用 Python编写的。如果你不懂任何编程语言但想学习一门,请选择Python,它非常适合初学者; 如果你熟悉其他语言,如Ruby,对阅读本书也大有帮助。

2.png

1.2二分查找

是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要 查找的元素包含在列表中,二分查找返回其位置;否则返回null。 下图是一个例子。

3.png

下面的示例说明了二分查找的工作原理。我随便想一个1~100的数字。

4.png

你的目标是以最少的次数猜到这个数字。你每次猜测后,我会说小了、大了或对了。 假设你从1开始依次往上猜,猜测过程会是这样。

5.png

这是简单查找,更准确的说法是傻找。每次猜测都只能排除一个数字。如果我想的数字是99, 你得猜99次才能猜到!

1.2.1 更佳的查找方式

下面是一种更佳的猜法。从 50 开始。

6.png

小了,但排除了一半的数字!至此,你知道1~50都小了。接下来,你猜75。

7.png

大了,那余下的数字又排除了一半!使用二分查找时,你猜测的是中间的数字,从而每次都 将余下的数字排除一半。接下来,你猜63(50和75中间的数字)

8.png

这就是二分查找,你学习了第一种算法!每次猜测排除的数字个数如下。

9.png

不管我心里想的是哪个数字,你在7次之内都能猜到,因为每次 猜测都将排除很多数字!

假设你要在字典中查找一个单词,而该字典包含240 000个单词, 你认为每种查找最多需要多少步?

如果要查找的单词位于字典末尾,使用简单查找将需要240 000步。使用二分查找时,每次 排除一半单词,直到最后只剩下一个单词

10.png

因此,使用二分查找只需18步——少多了!一般而言,对于包含n个元素的列表,用二分查 找最多需要log2n步,而简单查找最多需要n步。

对 数

你可能不记得什么是对数了,但很可能记得什么是幂。log10100相当于问“将多少个10相乘 的结果为100”。答案是两个:10 × 10 = 100。因此,log10100 = 2。对数运算是幂运算的逆运算。

11.png

对数是幂运算的逆运算

本书使用大O表示法(稍后介绍)讨论运行时间时,log指的都是log2。使用简单查找法查 找元素时,在最糟情况下需要查看每个元素。因此,如果列表包含8个数字,你最多需要检查8 个数字。而使用二分查找时,最多需要检查log n个元素。如果列表包含8个元素,你最多需要 检查3个元素,因为log 8 = 3(23 = 8)。如果列表包含1024个元素,你最多需要检查10个元素, 因为log 1024 = 10(210 =1024。

说 明

本书经常会谈到log时间,因此你必须明白对数的概念。如果你不明白,可汗学院 (khanacademy.org)有一个不错的视频,把这个概念讲得很清楚。

说 明

仅当列表是有序的时候,二分查找才管用。例如,电话簿中的名字是按字母顺序排列的, 因此可以使用二分查找来查找名字。如果名字不是按顺序排列的,结果将如何呢?