聊聊算法的时间复杂度与空间复杂度

938 阅读6分钟

复杂度的概念

算法是一段执行的程序, 可以理解成几行代码,或者一个方法; 算法的时间复杂度是指这段代码需要消耗的时间资源;算法的空间复杂度是指这段代码需要消耗的空间资源(空间资源通常是指占用的内存)。

大O复杂度表示法

通常我们在讨论一个算法时会说,这个算法时间复杂度是O(n​), 那个O(n^2​)。而这个O(n​)、O(n^2​)就是大O复杂度表示法。这个n​n^2​具体是怎么来的呢,下面简单举个例子:

int cal(int n) { 
  int sum = 0;									(1)
  for(int i = 1;i <= n; ++i){ 	(2)
    sum = sum + i;							(3)
  }															(4)
  return sum;									
}  

上面的代码是计算 1, 2, 3… n 的和一个方法,我们假设每一行代码cpu的时间都是相同的,每一行代码执行时间为run_time, 那这段代码的总执行时间 T(n) 是多少 ? 第1行为run_time, 第2行和第3行代码循环n次,时间为2 * n * run_time。所有总时间:

	T(n) = (2 * n + 1)* run_time

根据规律,可以总结成一个公式:

T(n) = O (f(n))

所以, 上面的O(n)、O(n^2)例子中,f(n) = n 以及 f(n) = n^2(2 * n + 1)* run_time 中run_time是常数, 当n足够大, 公式中的低阶、常量、系数都可以忽略不计,所有这段计算 1, 2, 3… n总和的代码时间复杂度是O(n)。

常见时间复杂度有:O(1)、O(n)、O(logn )、O(nlogn ) 、O(n2) 、O(n^{3})​

下面在举个空间复杂度的例子:

void print(int n){
  int i = 0;							 (1)
  int[] arr = new int[n];  (2)
  int j = 0;							 (3)
}

第1行和第3行代码中都是分别申请了一个空间存储变量, 都有数据规模n无关,所有可以忽略,第2行中申请了数量为n的数组空间。所有整段代码的空间复杂度是O(n)​

常见空间复杂度有: O(1)、O(n)、O(n2 )​

掌握算法的时间复杂度与空间复杂度有什么用

首先,对比几个算法的好坏需要结合使用场景,比如数据量,内存,数据特征等。同样一段代码,在不同机器上运行速度也是不同的。通常比较几个算法的性能,就需要在同一个机器,同一批数据,同一个环境下去运行对比测试它们所需要的运行时间。

但是,但开发者是使用或者选择一个算法时,通常是没办法精准的对比算法的优劣,并且时间成本也不允许。所有我们需要一个不用具体数据来测试, 就可以粗略估算出算法的执行效率, 这就是算法的时间复杂度与空间复杂度作用啦。

最好、最坏情况时间复杂度

什么情况下,一段代码会出现有最好、最坏的情况呢; 举个例子, 比如在一个长度为n的整数数组中去找一个数,找到就立马返回数组的下表。在循环查找的过程中,最好的情况就是数组第一个就要找的,所有最好情况时间复杂度为O(1); 如果数组最后一个是要找的, 这时就是最坏的情况,最坏情况时间复杂度为O(n)​

平均情况时间复杂度

像上面一个例子,在一个长度为n的整数数组中去找一个数, 有最好和最坏情况,最好、最坏情况时间复杂度无法衡量一段代码的执行效率,这时就需要用到平均情况时间复杂度。平均=所有情况总和/总次数。

那么平均情况时间复杂度怎么算出来呢,要找的数要么在数组里,要么不在,假设在与不在的概率是\frac{1}{2}​, 查找的数出现在0 ~ n-1 的位置概率是一样的,为\frac{1}{n}​, 所有查找的数在数组里概率为\frac{1}{2n}​。总过程为:

T(n) = 1 * \frac{1}{2n} + 2 * \frac{1}{2n} + 3 * \frac{1}{2n} + .. + n * \frac{1}{2n} = \frac{1 + n }{4}

去掉常量,复杂度为O(n)。

均摊时间复杂度

均摊时间复杂度就是一种特殊的平均时间复杂度,只能在特殊的场景才能是使用。不多说,举个例子,会java的对容器arraylist不陌生吧,arraylist有个默认长度的数组,add方法里,如果数组长度不够,是需要扩容的。下面以一段add方法伪代码为例:(为了代码简单易懂,以添加int为例)

int arr[] = new int[10]; //初始默认长度为10
int len = 10;
int index = 0;

void add(int element){
  if(index >= len){  // 超出长度,数组需要扩容,并复制值到一个新数组里
    final int newLen = len * 2;
    int new_arr[] = new int[newLen]; //申请2倍的数组
    for (int i = 0; i < len; ++i){
      new_arr[i] = arr[i];
		}
    arr = new_arr;
    len = newLen;
  }
  arr[index] = element;
  ++index;
}

当不扩容时, 这个add方法时间复杂度就是O(1), 当扩容时, if里面复制到新数组需要遍历一次,

int arr[] = new int[10]; //初始默认长度为10
int len = 10;
int index = 0;

void add(int element){
  if(index >= len){  // 超出长度,数组需要扩容,并复制值到一个新数组里
    final int newLen = len * 2;
    int new_arr[] = new int[newLen]; //申请2倍的数组
    for (int i = 0; i < len; ++i){
      new_arr[i] = arr[i];
    }
    arr = new_arr;
    len = newLen;
  }
  arr[index] = element;
  ++index;
}

当不扩容时, 这个add方法时间复杂度就是, 当扩容时, if里面复制到新数组需要遍历一次,

int arr[] = new int[10]; //初始默认长度为10
int len = 10;
int index = 0;

void add(int element){
  if(index >= len){  // 超出长度,数组需要扩容,并复制值到一个新数组里
    final int newLen = len * 2;
    int new_arr[] = new int[newLen]; //申请2倍的数组
    for (int i = 0; i < len; ++i){
      new_arr[i] = arr[i];
    }
    arr = new_arr;
    len = newLen;
  }
  arr[index] = element;
  ++index;
}

当不扩容时, 这个add方法时间复杂度就是O(1), 当扩容时, if里面复制到新数组需要遍历一次,数组默认长度假设是n, 扩容时的时间复杂度是O(n)。平均情况时间复杂度是多少呢,如果像上一个例子用概率论去计算也是可以,但是麻烦。我们假设需要添加11个数,添加第11个数时需要扩容,循环10次把前10个数复制到新的数组中然后把第11个数添加进去。添加前10个数时间复杂度都是O(1), 如果把扩容时循环10次分摊到添加前10个数操作中,那么添加前10个数操作都只是都运行了一行代码而已,还是常量级别的,所有这个add方法的平均时间复杂度就是O(1)。 通过分摊分析时间复杂度就叫做均摊时间复杂度。