持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第9天,点击查看活动详情
为什么需要设计
因为数据库比较复杂
糟糕的数据库设计:
- 数据冗余,浪费空间
- 数据库插入和删除都会麻烦、异常
- 程序的性能差
良好的数据库设计:
- 节省内存空间
- 保证数据库的完整性
- 方便我们开发系统
软件开发中,关于数据库的设计
- 分析需求:分析业务和需要处理的数据库的需求
- 概要设计:设计关系图E-R图
设计数据库的步骤:(博客为例)
-
收集信息,分析需求
- 用户表(用户登录注销,用户的个人信息,写博客,创建分类)
- 分类表(文章分类,谁创建的)
- 文章表(文章的信息)
- 评论表
- 友链表
- 自定义表(系统信息,某个关键的字,或主字段)
-
标识实体(把需求落地到每个字段)
-
标识实体之间的关系
- 写博客:user-->blog
- 创建分类:user-->category
- 关注:user-->user
- 评论:user-user-blog
三大范式
为什么需要数据规范化?
-
信息重复
-
更新异常
-
插入异常
- 无法正常显示信息
-
删除异常
- 丢失有效的信息
函数依赖
| 学号 | 姓名 | 年龄 | 学科 | 成绩 |
|---|---|---|---|---|
| 101 | 小明 | 18 | c1 | 80 |
| 102 | 小红 | 19 | c1 | 90 |
| 101 | 小明 | 18 | c1 | 80 |
设该表中的属性集为 U ,X,Y是 U 的子集。U就相当于是{学号,姓名,年龄},X是学号,Y是姓名。
依赖
如果一个关系不存在有两个元组的X属性值相同,但是Y属性值不相同,那么就称Y依赖于X。也就是说,在没有重名的情况下,如果两个学生的学号相同,那么他们的姓名就一定相同,这就说明姓名这个属性值是根据学号这个属性值确定的。
完全依赖
在Y依赖于X的前提下,Y不依赖于X的任何一个真子集,就称Y对X完全依赖
例如,表中的成绩不依赖于学科,也不依赖于学号,只依赖于学科和学号。所以成绩完全依赖于{学科,学号}
部分依赖
在Y依赖于X的前提下,只要Y依赖于X的一个真子集,就称Y对X部分依赖
例如,成绩依赖于学科和学号,但不依赖于姓名。所以成绩部分依赖于{学科,学号,姓名}
依赖关系是可以传递的
三大范式
第一范式(1NF)
原子性:保证每一列不可再分
第二范式(2NF)
前提:满足第一范式
非主属性必须完全依赖于候选码
第二范式需要确保表中的每一列都和主键相关,不能只和主键的一部分相关
第三范式(3NF)
前提:满足第一、二范式
任何非主属性不依赖于其他非主属性
第三范式需要确保数据表中的每一列数据和主键直接相关,而不能间接相关
博客:www.cnblogs.com/wsg25/p/961…
规范性和性能的问题
对于范式的缺点做出的操作
- 关联查询的表不得超过三张表
- 考虑商业化的需求和目标,(成本,用户体验!)数据库的性能更加重要
- 在规范性能的问题的时候,需要适当的考虑一下规范性
- 故意给某些表增加一些冗余的字段(从夺标查询变为单表查询)
- 故意增加一些计算列(从大数据量降低为小数据量的查询:索引)