Mysql之规范数据库设计持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第9天，点击查看活动详情

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第9天，点击查看活动详情

为什么需要设计

因为数据库比较复杂

糟糕的数据库设计：

良好的数据库设计：

软件开发中，关于数据库的设计

设计数据库的步骤：（博客为例）

收集信息，分析需求
- 用户表（用户登录注销，用户的个人信息，写博客，创建分类）
- 分类表（文章分类，谁创建的）
- 文章表（文章的信息）
- 评论表
- 友链表
- 自定义表（系统信息，某个关键的字，或主字段）
标识实体（把需求落地到每个字段）
标识实体之间的关系
- 写博客：user-->blog
- 创建分类：user-->category
- 关注：user-->user
- 评论：user-user-blog

为什么需要数据规范化？

函数依赖

设该表中的属性集为 U ，X，Y是 U 的子集。U就相当于是{学号，姓名，年龄}，X是学号，Y是姓名。

依赖

如果一个关系不存在有两个元组的X属性值相同，但是Y属性值不相同，那么就称Y依赖于X。也就是说，在没有重名的情况下，如果两个学生的学号相同，那么他们的姓名就一定相同，这就说明姓名这个属性值是根据学号这个属性值确定的。

完全依赖

在Y依赖于X的前提下，Y不依赖于X的任何一个真子集，就称Y对X完全依赖

例如，表中的成绩不依赖于学科，也不依赖于学号，只依赖于学科和学号。所以成绩完全依赖于{学科，学号}

部分依赖

在Y依赖于X的前提下，只要Y依赖于X的一个真子集，就称Y对X部分依赖

例如，成绩依赖于学科和学号，但不依赖于姓名。所以成绩部分依赖于{学科，学号，姓名}

依赖关系是可以传递的

三大范式

第一范式（1NF）

原子性：保证每一列不可再分

第二范式（2NF）

前提：满足第一范式

非主属性必须完全依赖于候选码

第二范式需要确保表中的每一列都和主键相关，不能只和主键的一部分相关

第三范式（3NF）

前提：满足第一、二范式

任何非主属性不依赖于其他非主属性

第三范式需要确保数据表中的每一列数据和主键直接相关，而不能间接相关

规范性和性能的问题

对于范式的缺点做出的操作