数据结构-概述总结

49 阅读5分钟

教材《数据结构(C 语言版)》 本文为自己整理的学习笔记。

1、数据结构的研究内容

用计算机解决一个具体问题的步骤:

1. 抽象数学模型
	实质:分析问题;提取操作对象;找出操作对象的关系;用数学语言描述 =>数据结构
2. 设计算法
3. 编程、测试、运行

举例:

序号操作对象算法操作对象的关系数据结构
图书管理系统每本书的信息(书名、 作者…)CRUD线性关系线性表、线性数据结构
五子棋问题各种棋局的状态走棋,(一个格局派生另一个格局)非线性关系
文件系统结构子目录、及文件CRUD非线性关系
地图导航问题坐标点最近距离非线性关系

小结:

  • 这些问题的共性,无法用数学的公式和方程来描述,是一些非数值计算的程序设计问题。
  • 描述非数值计算的数学模型不是数学方程,而是诸如表树图之类的具有逻辑关系的数据。
  • 数据结构是一门研究非数值计算的程序设计中计算机的操作对象以及它们之间的关系和操作的学科。

2、基本概念和术语

2.1 数据、数据元素、数据项、数据对象

  • 数据
    • 是能输入计算机且能被计算机处理的各种符号的集合
      • 信息的载体
      • 是对客观事物符号化的表示
      • 能够被计算机识别、存储和加工
    • 包括:
      • 数值型的数据:整数、实数
      • 非数值型的数据:文字、图像、图形、声音
  • 数据元素
    • 是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理
    • 也简称为元素,或称为记录、结点或顶点
    • 一个数据元素可以由若干个数据项组成
  • 数据项
    • 构成数据元素的不可分割的最小单位
    • 数据、数据元素、数据项三者之间的关系: 例:学生表 > 个人单条记录 > 学号、姓名…..
  • 数据对象
    • 是性质相同的数据元素的集合,是数据的一个子集。 例如:
      • 整数数据对象是集合 N={0,1,-2…}
      • 字符数据对象是集合 C={‘A’,‘B’….}
      • 学籍表也可看作一个数据对象

数据元素和数据对象

  • 数据元素—–组成数据的基本单位
    • 与数据的关系:是集合的个体
  • 数据对象—–性质相同的数据元素的集合
    • 与数据的关系:集合的子集

2.2 数据结构 数据结构

  • 数据元素不是孤立存在的,它们之间存在着某种关系,数据元素之间的关系称为结构。
  • 是指相互之间存在一种或多种特定关系的数据元素集合

数据结构包括以下三个方面的内容

  1. 数据元素之间的逻辑关系,也称为逻辑结构
  2. 数据元素及其关系在计算机内存中的表示(映像),称为数据的物理结构或数据的存储结构。
  3. 数据的运算和实现,即对数据元素可以施加的操作以及这些操作在相应的存储结构上的实现。

数据结构的两个层次

  • 逻辑结构
    • 描述数据元素之间的逻辑关系
    • 与数据的存储无关,独立于计算机
    • 是从具体问题抽象出来的数学模型
  • 物理结构(存储结构)
    • 数据元素及其关系在计算机存储器中的结构(存储方式)
    • 是数据结构在计算机中的表示
  • 逻辑结构与存储结构的关系
    • 存储结构是逻辑结构的映像与元素本身的映像
    • 逻辑结构是数据结构的抽象,存储结构是数据结构的实现
    • 两者综合起来建立了数据元素之间的结构关系。

逻辑结构的种类

划分方式一: (1)线性结构

有且仅有一个开始和一个终端结点,并且所有结点最多只有一个直接前趋和一个直接后继。
 例如:线性表、栈、队列、串

(2)非线性结构

一个结点可能有多个直接前趋和直接后继
 例如:树、图

划分方式二:

(1) 集合结构:结构中的数据元素除了同属于一个集合的关系外,无任何其他关系

(2)线性结构:结构中的数据元素之间存在着一对一的线性关系

(3)树形结构:结构中的数据元素之间存在着一对多的层次关系

(4)图形结构:结构中的数据元素之间存在着多对多的任意关系

存储结构的种类

  • 顺序存储结构
  • 链式存储结构
  • 索引存储结构
  • 散列存储结构

顺序存储结构

  • 用一组连续的存储单元依次存储数据元素,数据元素之间的逻辑关系由元素的存储位置来表示。
  • C语言中用数组来实现顺序存储结构

链式存储结构

  • 用一组任意的存储单元存储数据元素,数据元素之间的逻辑关系用指针来表示。
  • C语言中用指针来实现链式存储结构

索引存储结构

  • 在存储结点信息的同时,还建立附加的索引表
  • 索引表中的每一项称为一个索引项
  • 索引项的一般形式是:(关键字,地址)
  • 关键字是能唯一标识一个结点的那些数据项
  • 若每个结点在索引表中都有一个索引项,则该索引表称之为稠密索引,若一组结点在索引表只对应一个索引项,则该索引表称之为稀疏索引。

散列存储结构

  • 根据结点的关键字直接计算出该结点的存储地址