数据结构与算法基础概念

344 阅读7分钟

一、数据结构的基本术语

1、数据

程序的操作对象,用于描述客观事物. 数据的特点: 1、可以输入到计算机 2、可以被计算机处理

2、数据项

一个数据元素由若干数据项组成

3、数据元素

组成数据的对象的基本单位

4、数据对象

性质相同的数据元素的集合(类似于数组)

5、结构

数据元素之间不是独立的,存在特定的关系.这些关系即是结构;

6、数据结构

指的数据对象中的数据元素之间的关系

数据结构关系图

7、逻辑结构

逻辑结构: 指的是数据对象中的数据元素之间的相互关系. 逻辑结构分为四种: 集合结构,线性结构,树形结构,图形结构. 具体采用什么的数据结构,是需要根据实际业务需求来进行合理的设计.

集合结构: 集合结构中的数据元素除了同属于一个集合外,它们之间没有其他关系. 各个数据元素是"平等"的. 它们的共同属性是:"同属于一个集合".

线性结构: 线性结构中的数据元素之间是一对一的关系.常用的线性结构有:线性表,栈,队列,双队列,数组,串。

树型结构: 重要的非线性数据结构。树形数据结构可以表示数据表素之间一对多的关系.树型结构中的数据元素之间存在一种一对多的层次关系. 常见的树形结构: 二叉树,B树,哈夫曼树,红黑树等.

图形结构: 图形结构的数据元素是多对多的关系. 常见的图形结构: 邻近矩阵,邻接表.

逻辑结构1

逻辑结构2

逻辑结构3

8、存储结构

存储结构指的是数据的逻辑结构在计算机的存储形式.数据元素的存储结构形式有2种: 顺序存储和链式存储;

顺序存储结构: 是指把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的.

链式存储结构: 是把数据元素放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的. 数据元素的存储关系并不能反映逻辑关系,因此需要用一个指针存放数据元素的地址,这样通过地址就可以找到相关关联数据元素的位置.

顺序存储结构
链式存储结构

二、算法

算法: 是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作.而数据结构如果脱离算法,或者算法脱离数据结构都是无法进行的. 所以在大学课程里,即便单独算法课程里也涵盖了数据结构的内容.

程序设计 = 数据结构 + 算法

算法与数据结构的关系

1、算法的特性

算法必须具备几个基本特性: 输入,输出,有穷性,确定性和可行性;

输入输出,很好理解. 在解决问题时必须有已知条件,当然有些算法可能没有输入. 但是算法至少有一个或多个输出.否则没有输出,没有结果.你用这个算法干吗?

有穷性: 指的是算法在执行有限的步骤之后,自动结束而不会出现无限循环,且每一个步骤在可接受的时间内完成.

确定性: 算法的每一个步骤都具有确定的含义,不能出现二义性; 算法在一定条件下,只有一条执行路径,相同的输入只能有唯一的输出结果.

可行性: 算法的每一步都必须是可行的,换句话说,每一步都能通过执行有限次数完成.

2、算法的设计要求

正确性

算法的正确性是指算法至少应该具有输入,输出和加工处理无歧义性,能正确反映问题的需求,能够得到问题的正确答案; 正确分为4个层次:

(1).算法程序没有语法错误;

(2).算法程序对于合法的输入数据能够产生满足要求的输出结果;

(3).算法程序对于非法的输入数据能够得出满足规格说明的结果;

(4).算法程序对于精心选择的,甚至刁钻的测试数据都有满足要求的输出结果;

可读性 可读性: 算法设计的另一个目的是为了便于阅读,理解和交流; 可读性高有助于人们理解算法,晦涩难懂的算法往往隐含错误,且不容易发现并且难于调试和修改; 注意, 不要犯初学者的错误; 认为代码越少,就越牛逼! 如果有这样的想法, 在团队协作的今天.不再是个人英雄主义的时代! 可读性是算法好坏的很重要的标志!

健壮性 一个好的算法还应该能对输入数据的不合法的情况做出合适的处理.考虑边界性,也是在写代码经常要做的一个处理; 比如,输入时间或者距离不应该是负数; 健壮性: 当输入数据不合法时,算法也能做出相关处理,而不是产生异常和莫名其妙的结果;

时间效率高和存储量低 生活中,人们希望花最少的钱,用最短的时间,办最大的事. 算法也是一样的思想. 用最少的存储空间,花最少的时间,办成同样的事.就是好算法!

3、算法的时间复杂度

推导大O阶方法:

1、用常数1取代运行时间中所有加法常数;

2、在修改后的运行次数函数中,只保留最高阶项;

3、如果在最高阶项存在且不是1,则去除与这个项相乘的常数;

1、常数阶
//1+1+1 = 3
void testSum1(int n){
    int sum = 0;                //执行1次
    sum = (1+n)*n/2;            //执行1次
    printf("testSum2:%d\n",sum);//执行1次
}

这个算法的运行次数函数是f(n) = 3;根据我们大O时间复杂度表示,第一步先把常数项改成1. 在保留最高阶时发现,它根本没有最高阶. 所以这个算法的视觉复杂度为O(1);

2、线性阶
void add2(int x,int n){
    for (int i = 0; i < n; i++) {
        x = x+1;
    }
}

这段代码的循环的视觉复杂度为O(n).

3、对数阶
int count = 1;
while(count < n){
	count = count * 2;
}

count = count * 2 ; 每次执行这句代码,就会距离n更近一步; 也就是说, 有多少个2相乘后大于n,则会退出循环.所以,这个循环时间复杂度为: O(logn).

4、平方阶
//x=x+1; 执行n*n次
void add3(int x,int n){
    for (int i = 0; i< n; i++) {
        for (int j = 0; j < n ; j++) {
            x=x+1;
        }
    }
}

以上代码的循环次数为O(n^2);

5、立方阶
void testB(int n){
    int sum = 1;                         //执行1次
    for (int i = 0; i < n; i++) {        //执行n次
        for (int j = 0 ; j < n; j++) {   //执行n*n次
            for (int k = 0; k < n; k++) {//执行n*n*n次
                sum = sum * 2;          //执行n*n*n次
            }
        }
    }
}

以上代码的循环次数为O(n^3);

常用的时间复杂度
大家在查找一个n个随机数字数组中的某个数字,最好的情况是第一个数字就是, 那么算法的时间的复杂度为O(1). 但也有可能这个数字就在最后一个位置上,也就是算法时间复杂度为O(n). 这是最坏的情况了.

4、算法的空间复杂度

程序空间计算因素:

  1. 寄存本身的指令
  2. 常数
  3. 变量
  4. 输入
  5. 对数据进行操作的辅助空间

在考量算法的空间复杂度,主要考虑算法执行时所需要的辅助空间. 空间复杂度计算:

int n = 5;
    int a[10] = {1,2,3,4,5,6,7,8,9,10};
    
    //算法实现 空间复杂度O(1)
    int temp;
    for(int i = 0; i < n/2 ; i++){
        temp = a[i];
        a[i] = a[n-i-1];
        a[n-i-1] = temp;
    }
    
    //算法实现  空间复杂度O(n)
    int b[10] = {0};
    for(int i = 0; i < n;i++){
        b[i] = a[n-i-1];
    }
    for(int i = 0; i < n; i++){
        a[i] = b[i];
    }