5000字总结MySQL单表查询,新手看这一篇足够了!

783 阅读9分钟

通过写SQL查询,我们可以发现很多简单查询语句主要就是由一些算术操作、字段操作、函数还有各种子句构成的,今天我们从这个角度对MySQL单表查询的基础知识进行一个汇总。

  • 计算:
    • 计算字段
    • 算术操作符
    • 算术计算
    • 字段拼接
    • 格式化显示
  • 函数:
    • 统计函数
    • 其他常用函数
  • 子句:
    • 排序
    • 过滤
    • 分组
    • 分组过滤
    • 去重

以这份模拟薪酬统计表为例

Alt

字段解读: id(工号),name(员工姓名),dep(部门),post(职位),years(工作年限),sal(薪酬),bon(奖金)

计算部分

  • 1.计算字段说明

    很多时候,存在数据库表中的数据不是我们直接需要的,要进行一些计算、清洗或者格式化等操作,所以就有了计算字段的存在,它们不实际存在于数据库表中,是运行时在select语句中创建的。

  • 2.算术操作符

    算术操作符:+ 加法,-  减法,*  乘法,/(DIV) 除法,%(MOD) 求余

  • 3.算术计算

      # 统计一下CFO的年薪
      select name, sal*12+bon
      from eg
      where post = 'cfo';
    

  • 4.字段拼接及列别名

    列别名: 别名是一个字段或者值的替换名,可以用关键字AS赋予(也可以省略掉AS)。

    在上面的例子中,如果要对计算后的年薪赋予一个名称,修改第一行代码即可

      select name, sal*12+bon as '年薪'
    

    下面我们看下使用concat() 函数来进行字段拼接 # 将员工职位标注在员工名后面 select concat(name, post) from eg;

  • 5.格式化显示

    上面例子是字段的拼接,但是显然看起来不方便,所以我们进一步看看如何进行格式化显示,假如我们现在需要让每个员工的岗位、年薪显示在一起,构成一个“员工信息”字段 select concat('姓名:', name, '\t', '(', '岗位:', post, '\t', '年薪:', sal*12, ')') as '员工信息' from eg; #这里因为有些员工奖金为null,无法有效参与计算,所以年薪的算法一律去掉奖金部分

函数部分

  • 1.常用统计函数

    count():返回某列的行数

    avg():返回某列的平均值

    sum():返回某列值的和

    max():返回某列最大值

    min():返回某列最小值

    我们先看下这些函数的简单应用,后面子句中还会提到 select count(id) from eg; select avg(sal) from eg; select sum(sal) from eg; select max(sal) from eg; select min(sal) from eg;

    通过上面的统计数据,我们就可以对这个15人团队的整体人力成本有一个大致了解

  • 2.文本处理函数

    left():返回串左边的字符

    length():返回串的长度

    locate():找出串的一个子串

    lower():将串转换为小写

    ltrim():去掉串左边的空格

    right():返回串右边的字符

    rtrim():去掉串右边的字符

    soundex():返回串的soundex值

    substring():返回子串的字符

    upper():将串转换为大写

  • 3.时间日期函数

    adddate():增加一个日期(天、周等)

    addtime():增加一个时间(时、分等)

    curdate():返回当前日期

    curtime():返回当前时间

    date():返回日期时间的日期部分

    datediff():计算两个日期之差

    date_add():高度灵活的日期运算函数

    date_format():返回一个格式化的日期或时间串

    day():返回一个日期的天数部分

    dayofweek():对于一个日期,返回对应的星期几

    hour():返回一个时间的小时部分

    minute():返回一个时间的分钟部分

    month():返回一个日期的月份部分

    now():返回当前日期和时间

    second():返回一个时间的秒部分

    time():返回一个日期时间的时间部分

    year():返回一个日期的年份部分

  • 4.数值处理函数

    abs():返回一个数的绝对值

    cos():返回一个角度的余弦

    exp():返回一个数的指数值

    mod():返回除操作的余数

    pi():返回圆周率

    rand():返回一个随机数

    sin():返回一个角度的正弦

    sqrt():返回一个数的平方根

    tan():返回一个角度的正切

      --《MySQL必知必会》
    

    上面是从《MySQL必知必会》里直接摘录的一些常用函数,我们在这里进行一下汇总,需要的时候可以方便地参考,就不一一举例说明了。

子句部分

  • 1.MySQL语法顺序

    select-->from-->where-->group by-->having-->order by-->limit.

  • 2.MySQL执行顺序

    from --> where --> group by --> having --> select --> distinct --> order by --> limit.

  • 3.排序

    • 基本排序

    查询到的数据一般是以在底层表中出现的顺序显示的,如果我们有排序需求,则不能以此为依赖,而是要严谨地使用order by子句来明确控制。 # 按照员工工龄进行排序 select name, years from eg order by years;

      ![](https://p1-jj.byteimg.com/tos-cn-i-t2oaga2asx/gold-user-assets/2020/4/19/17192a733c4c8ce5~tplv-t2oaga2asx-image.image)
    
    • 指定排序方向

    上面的操作查询了员工姓名与工龄,并按照工龄进行排序,如果需要让工龄越久的越靠前,我们就可以指定一下排序方向 select name, years from eg order by years desc; # asc(升序)/ desc(降序),默认是升序

    • 多列排序

    下面我们看下如何对多个列进行排序

      	select name, years, sal, bon
      	from eg
      	order by years asc, sal desc;
    

这里要注意,多列排序时,当前一列中有相同行时,才对相同行按照下一列的规则继续启动排序。
  • 4.过滤

    工作用的数据库表中一般包含大量数据,很少会一次全部查询,所以会使用where子句加过滤条件来查询我们需要的数据。

    • 认识操作符

      • 比较操作符

      =(等于),<>、!=(不等于),<(小于),<=(小于等于),>=(大于等于),>(大于),between(在指定两个值之间)

      • 逻辑操作符

      and(逻辑与),or(逻辑或),in(指定条件范围),not(逻辑非)

      • 匹配操作符

      like,regexp

    • 单条件匹配

        select name from eg where years > 3; 
      

        select name, years from eg where years != 1;  # 不匹配查询
      

      select name from eg where bon is null; # 空值查询

    • 多条件匹配 select name, post, sal from eg where post='clerk' and sal>10000;

        select name, years from eg where sal between 10000 and 20000;  # 范围值查询
      

      select name, years from eg where years not in (1, 3, 5); # 指定条件范围,并进行非范围筛选

    • 搜索模式

    前面提到的匹配方式都是针对已知值,但是实际情况中并不总是这样,有时候我们需要匹配一些字面值,但是我们可能并不清楚她们的全貌,这里就需要用到搜索模式,先认识下简单的通配符:%(任何字符出现任意次数),_(匹配单个字符),这里我们会用到like和regexp两种操作符,一起来看下。 select name from eg where name like 'a%'; # 查询姓名以a开头的员工

      ![](https://p1-jj.byteimg.com/tos-cn-i-t2oaga2asx/gold-user-assets/2020/4/19/17192a74a3743fa1~tplv-t2oaga2asx-image.image)
      
      	select name from eg where name like '_a%';  # 查询姓名第二个字母为a的员工
      	
      ![](https://p1-jj.byteimg.com/tos-cn-i-t2oaga2asx/gold-user-assets/2020/4/19/17192a74c2e57d7d~tplv-t2oaga2asx-image.image)
      	select name from eg where name like 'an';
      	select name from eg where name regexp 'an';
      	
      ![](https://p1-jj.byteimg.com/tos-cn-i-t2oaga2asx/gold-user-assets/2020/4/19/17192a74ec3e8a71~tplv-t2oaga2asx-image.image)
      
      关于regexp的用法这里会涉及到正则表达式,因为正则的内容还比较多,这篇文章里我们只先做一个简单了解,后面会在另一个专题来说明,这里我们注意一下regexp和like的一些使用区别就好,通过上面的例子我们可以看到like匹配的是整个列值,所以当'an'只在列值中出现时,like是不会返回对应值的,而regexp操作时只要被匹配的文本在列值里出现了,那么相应值就会被返回。
    
  • 5.分组

    通过group by子句可以对数据进行分组,经常会和统计函数一起使用,接下来我们看下它们的具体用法。

    • 基本分组 select dep, count(*) as num from eg group by dep; # 创建分组并按照部门统计人数

    • 分组排序

        select years,avg(sal) as avg_sal
        from eg
        group by years
        order by avg_sal desc;  # 按工龄分组并分别计算平均薪资
      

    • 多字段分组 select dep, years, avg(sal) as dep_year_avg from eg group by dep, years; # 先按照部门,再按照工龄进行分组

  • 6.分组过滤

    如果我们要针对分组进行过滤,按照之前的逻辑就应该在分组后面再加上一个过滤条件,这里需要记住,group by子句后面是不可以再使用where的,这里就引出了having子句,可以用having来筛选成组后的数据。

    • 分组过滤 select dep, count(*) as num from eg group by dep having num > 5; # 查询人数大于5的部门

    • where和having的一些使用区别

      1.where是在数据分组前进行过滤,having是在数据分组后进行过滤;

      2.having可以使用字段别名,where不可以;

      3.where是直接从数据表中筛选字段,having是从select查询的字段中再进行筛选,所以having后面跟的字段一定要在前面已经出现过;

      4.having可以使用统计函数,where不可以;

      5.group by 子句后面只能用having,不能用where;

  • 7.去重

    有时候,我们只想知道想要的数据都有些什么不同类别,而不是全部取出它们,这个时候就需要使用关键字distinct对查询到的数据进行去重处理 select distinct dep from eg; # 查询共有多少部门

    这里需要注意的是,进行去重操作时,distinct必须在所有字段的最前面,并且它应用于所有字段而不仅是前置它的字段,也就是说如果distinct后面有多个字段,只有它们组合起来的值是相等的才会被去重,看下面例子 select distinct dep, post from eg;

    不过,当统计函数作为计算字段出现时,distinct可以和统计函数组合使用,就不一定要放在列的最前面了,举个之前练习中遇到的例子,下面语句中distinct的用法也是OK的

      select activity_date as day, count(distinct user_id) as active_users
    
  • 8.限制

    通过条件查询有时候符合需求的数据记录会太多,这时可以通过limit来限制数量 select name, post from eg where post = 'clerk' limit 3; # 这里指返回不超过3行的数据

    我们也可以自己定义偏移量,也就是让它从我们想要的行数开始返回 select name, post from eg where post = 'clerk' limit 3, 3;

    不过这里需要注意,在查询时行数是从0算起的,所以 limit3, 3 指的是从第四行开始返回3行数据,为了更加清晰,MySQL5还支持另一种替代语法,如下所示 select name, post from eg where post = 'clerk' limit 3 offset 3;

    (不过,我个人觉得前面第一种还是挺顺眼的,后面这个反倒看着懵,哈哈哈哈哈^~^)

    如果limit限制的数量大于全部数量的话,也不会报错,会返回全部结果,如下 select name, years from eg where years > 5 limit 3;