软考 数据库系统笔记

1,305 阅读4分钟

数据库模式

  • 三级模式-两级映射 选择题
  • 三级模式:内模式、概念模式、外模式
  • 两级映射:概念模式 - 内模式映射 外模式 - 概念模式映射

ER模型

关系代数与元组演算 选择题

并 交 差

笛卡尔积

投影 选择 联接

规范化理论 ***

函数依赖

  • 设R(U)是属性U上的一个关系模式,X和Y是U的子集,r为R的任一关系,如果对于r中的任一两个元组U,V,只要有U[x] = V[x],就有U[Y] = V[Y],则称X函数决定Y,或称Y函数依赖于X,记住X->Y

价值与用途

  • 非规范化的关系模式,可能存在的问题包括:数据冗余、更新异常、插入异常、删除异常

求候选键

  • 将关系模式的函数依赖关系用“有向图”的方式表示
  • 找入度为0的属性,并以该属性集合为起点,尝试遍历有向图,若能正常遍历图中所有结点,则该属性集即为关系模式的候选键
  • 若入度为0的属性集不能遍历图中所有结点,则需要尝试性的将一些中间结点(即有入度,也有出度的结点)并入入度为0的属性集中,直至该集合能遍历所有结点,集合为候选键

范式 ***

  • 第一范式(1NF)在关系模式R中,当且仅当所有域只包含原子值,即每个分量都是不可再分的数据项,则称R是第一范式

  • 第二范式(2NF)当且仅当R是1NF,且每一个非主属性完全依赖主键(不存在部分依赖)时,则称R是第二范式

  • sno cno 主键,存在部分依赖cno->credit学分,存在问题数据冗余、更新异常、插入异常、删除异常,解决办法,cno和credit变成新表

  • 第三范式(3NF)当且仅当R是1NF,且E中没有非主属性传递依赖于码时,则称R是第三范式

解决办法把DNO、DNAME、LOCATION放入新表

模式分解

并发控制

概念

原子性 一致性 隔离性 持续性

并发存在的问题

封锁协议

  • 一级封锁协议。事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。可防止丢失修改。

  • 二级封锁协议。一级封锁协议加上事务T在读取数据R之前先对其加S锁,读完后释放S锁。可防止丢失修改,还可以防止读“脏数据”

  • 三级封锁协议。一级封锁协议加上事务T在读取数据R之前先对其加S锁,直到事务结束才释放。可防止丢失修改、防止读“脏”数据与防止数据重复读

  • 两段锁协议。可串行化。可能发生死锁

数据库完整性约束

  • 用户标识和鉴定:最外层的安全保护措施,可以使用用户账户、口令及随机数检验等方式

  • 存取控制:对用户进行授权,包括操作类型(如查找、插入、删除、修改等动作)和数据对象(主要是数据范围)的权限

  • 密码存储和传输:对远程终端信息用密码传输

  • 视图的保护:对视图进行授权

  • 审计:使用一个专用文件或数据库,自动将用户对数据库的所有操作记录下来

数据备份

  • 冷备份也称为静态备份,是将数据库正常关闭,在停止状态下,将数据库的文件全部备份(复制)下来
  • 热备份也称为动态备份,是利用备份软件,在数据库正常运行的状态下,将数据库中的数据文件备份出来

  • 完全备份:备份所有数据

  • 差量备份:仅备份上一次完全备份之后变化的数据

  • 增量备份:备份上一次备份之后变化的数据

  • 日志文件:事务日志是正对数据库改变所做的记录,它开源记录针对数据库的任何操作,并将记录结果保存在独立的文件中

数据挖掘方法分类

方法

  • 决策树
  • 神经网络
  • 遗传算法
  • 关联规则挖掘算法

分类

  • 关联分析:挖掘出隐藏在数据间的相互关系

  • 序列模式分析:侧重点是分析数据间的前后关系

  • 分类分析:为每一个记录赋予一个标记再按标记分类

  • 聚类分析:分类分析法的逆过程

大数据

鸣谢

B站 www.bilibili.com/video/BV1Eb…