Mysql之规范数据库设计

151 阅读3分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第9天,点击查看活动详情

为什么需要设计

因为数据库比较复杂

糟糕的数据库设计:

  • 数据冗余,浪费空间
  • 数据库插入和删除都会麻烦、异常
  • 程序的性能差

良好的数据库设计:

  • 节省内存空间
  • 保证数据库的完整性
  • 方便我们开发系统

软件开发中,关于数据库的设计

  • 分析需求:分析业务和需要处理的数据库的需求
  • 概要设计:设计关系图E-R图

设计数据库的步骤:(博客为例)

  • 收集信息,分析需求

    • 用户表(用户登录注销,用户的个人信息,写博客,创建分类)
    • 分类表(文章分类,谁创建的)
    • 文章表(文章的信息)
    • 评论表
    • 友链表
    • 自定义表(系统信息,某个关键的字,或主字段)
  • 标识实体(把需求落地到每个字段)

  • 标识实体之间的关系

    • 写博客:user-->blog
    • 创建分类:user-->category
    • 关注:user-->user
    • 评论:user-user-blog

三大范式

为什么需要数据规范化?

  • 信息重复

  • 更新异常

  • 插入异常

    • 无法正常显示信息
  • 删除异常

    • 丢失有效的信息

函数依赖

学号姓名年龄学科成绩
101小明18c180
102小红19c190
101小明18c180

设该表中的属性集为 U ,X,Y是 U 的子集。U就相当于是{学号,姓名,年龄},X是学号,Y是姓名。

依赖

如果一个关系不存在有两个元组的X属性值相同,但是Y属性值不相同,那么就称Y依赖于X。也就是说,在没有重名的情况下,如果两个学生的学号相同,那么他们的姓名就一定相同,这就说明姓名这个属性值是根据学号这个属性值确定的。

完全依赖

在Y依赖于X的前提下,Y不依赖于X的任何一个真子集,就称Y对X完全依赖

例如,表中的成绩不依赖于学科,也不依赖于学号,只依赖于学科和学号。所以成绩完全依赖于{学科,学号}

部分依赖

在Y依赖于X的前提下,只要Y依赖于X的一个真子集,就称Y对X部分依赖

例如,成绩依赖于学科和学号,但不依赖于姓名。所以成绩部分依赖于{学科,学号,姓名}

依赖关系是可以传递的

三大范式

第一范式(1NF)

原子性:保证每一列不可再分

第二范式(2NF)

前提:满足第一范式

非主属性必须完全依赖于候选码

第二范式需要确保表中的每一列都和主键相关,不能只和主键的一部分相关

第三范式(3NF)

前提:满足第一、二范式

任何非主属性不依赖于其他非主属性

第三范式需要确保数据表中的每一列数据和主键直接相关,而不能间接相关

博客:www.cnblogs.com/wsg25/p/961…

规范性和性能的问题

对于范式的缺点做出的操作

  • 关联查询的表不得超过三张表
  • 考虑商业化的需求和目标,(成本,用户体验!)数据库的性能更加重要
  • 在规范性能的问题的时候,需要适当的考虑一下规范性
  • 故意给某些表增加一些冗余的字段(从夺标查询变为单表查询)
  • 故意增加一些计算列(从大数据量降低为小数据量的查询:索引)