linux数据处理(一)

113 阅读2分钟

这是我参与「第四届青训营」笔记创作活动的的第15天

简述

  1. grep 命令:筛选数据
  2. sort 命令:为文件排序
  3. wc 命令:文件的统计
  4. uniq 命令:删除文件中的重复内容
  5. cut 命令:剪切文件的一部分内容

1. grep 命令:筛选数据

grep 是 Globally search a Regular Expression and Print 的缩写,意思是“全局搜索一个正则表达式,并且打印”。

grep 命令的功能简单说来是在文件中查找关键字,并且显示关键字所在的行。

grep 命令极为强大,也是 Linux 中使用最多的命令之一。它的强大之处在于它不仅可以实现简单的查找,而且可以配合 正则表达式 来实现比较复杂的查找。

grep 的简单用法

grep 的使用方法有很多种,我们一开始先学习最基本的用法:

grep text file

可以看到,上面就是 grep 命令的最基本用法。

text 代表要搜索的文本,file 代表供搜索的文件。

我们用实际的例子来学习:比如我要在用户的家目录的 .bashrc 文件中搜索 alias 这个文本,而且显示所有包含alias的行。

grep alias .bashrc

如果我们要用 grep 命令在一个文件中查找用空格隔开的文本,那么就要加上双引号,例如:

grep "Hello World" file2

如果我们要用 grep 命令在一个文件中查找用空格隔开的文本,那么就要加上双引号,例如:

grep "Hello World" file2

-i 参数:忽略大小写

默认的情况下,grep 命令是区分大小写的,也就是说搜索的文本将严格按照大小写来搜索。比如我搜索的文本是 text,那么就不会搜出 Text,tExt,TEXT 等等文本。

但是我们可以给 grep 加上 -i 参数,使得 grep 可以忽略大小写。i 是英语 ignore 的缩写,表示“忽略”。

例如:

grep -i alias .bashrc

-n 参数:显示行号

-n 参数的作用很简单,就是显示搜索到的文本所在的行号。n 是英语 number 的缩写,表示“数字,编号”。

grep -n alias .bashrc

-v 参数:只显示文本不在的行

-v 参数很有意思,v 是 invert 的缩写,表示“颠倒,倒置”。-v 参数的作用与正常 grep 的作用正好颠倒,就是只显示搜索的文本不在的那些行。