Linux常用文本处理命令(echo、sort、uniq、tr、cut、split、eval、seq)

182 阅读4分钟

一、linux中常用的文本处理命令

1.tr命令 (删除、替换、压缩)

tr命令是用于标准输入的字符进行替换、压缩和删除。

命令格式:tr [选项]...SET1 [SET2]

常用选项:

选项作用
-c保留字符集1的字符,其他字符包括换行符\n用字符集2替换
-d删除所有属于字符集1的字符
-s将连续重复的字符串压缩成一个
-t字符集2 替换 字符集1,不加选项效果相同

演示:

1.不加任何选项的情况下替换指定的字符。

[root@localhost zhu]# echo "hello linux" |tr he 11     //将he替换成11
11llo linux


[root@localhost zhu]# cat /etc/issue          
\S
Kernel \r on an \m
[root@localhost zhu]# cat /etc/issue |tr [a-z] [A-Z]  //把/etc/issue下的文件全部改成大写。
\S
KERNEL \R ON AN \M



[root@localhost zhu]# echo "192.168.83.101" |tr '.' ' '   //将所有.替换成空格
192 168 83 101

2.-d,删除指定的字符。

[root@localhost zhu]# echo hello linux        
hello linux
[root@localhost zhu]# echo "hello linux" |tr -d "un"   //删除指定un的字符
hello lix
[root@localhost zhu]# echo "hello linux" |tr -d " "    //删除空格
hellolinux

3.-s,将连续重复的字符串压缩成一个。

[root@localhost zhu]# tr -s 1    //将连续的1压缩成一个
11111
1
121212
121212
112211
1221
[root@localhost zhu]# echo "hello linux" |tr -s l     //将连续的l压缩成一个
helo linux

面试题随机生成密码。 tr -dc "字符集1":符合字符集1的部分不做处理,其他字符进行删除。/dev/urandom可随机生成编码

[root@localhost zhu]# cat /dev/urandom |tr -dc '[:alnum:]'|head -c12    
GsIzTxVl30L4[root@localhost zhu]# 
[root@localhost zhu]# cat /dev/urandom |tr -dc '[:alnum:]'|head -c12

2.seq命令 打印数字

命令格式:seq [选项]... 尾数

选项说明
-s指定分隔符

演示:

1.-s指定分隔符,默认分隔符为“$”换行符. image.png 2.可以结合bc来算出结果 image.png

3.cut命令 (取列 截取字段或字符串)

用于显示行中的指定部分,删除文件中指定字段。、

命令格式:cut [选项] 参数 常用选项:

选项作用
-d指定分隔符(默认分隔符为Tab)
-f n按字段进行截取。指定第n个字段;1-3表示从第1个字段到第3个字段;1,4,7表示第1、第4、第7个字段
-b以字节为单位进行截取
-c以字符为单位进行截取
–complement排除所指定的字段
–output-delimiter更改输出内容的分隔符

演示:

1.-d 指定分隔符,-f 按字段进行截取。 image.png image.png image.png

2.cut命令无法将连续的字符当做分隔符所以要和tr配合使用。

image.png 3.也可以根据字符数来查找 image.png

4.–complement,排除所指定的字段。 image.png

5.–output-delimiter,更改输出内容的分隔符。 image.png

4.sort命令 (排序)

sort将文件的每一行作为一个单位相互比较,比较原则是从首字符向后依次按ASCII码进行比较,最后将它们按升序输出。(以行为单位来排序输出)

命令格式:sort [选项] 参数 常用选项:

常用选项作用
-n按照数字进行排序(默认升序)
-r反向排序(倒序)
-u等同于uniq,表示相同的数据仅显示一行
-t指定字段分隔符,默认使用Tab键分隔
-k指定排序字段(不指定则默认第一个字段)
-f忽略大小写,会将小写字母都转换为大写字母来进行比较
-b忽略每行前面的空格
-o <输出文件>将排序后的结果转存到指定文件中

演示:

1.先准备一个文件,每行随意填写数字,sort不加任何选项,默认先按照按首字母排序,随后再按照第二个字母进行排序。 image.png

2.-n,按照数字排序。

image.png 3.-nr,按照数字倒序排序。 image.png

4.-u,合并重复行,相同数据只显示一行。 image.png

5.uniq命令(去重)

uniq命令用于报告或者忽略文件中连续的重复行,常与sort命令结合使用。

命令格式:uniq [选项] 参数

常用选项:

常用选项作用
-c统计连续重复的行的次数,并且合并重复的行
-u显示仅出现一次的行(包括不连续的重复行)
-d仅显示重复出现的行(必须是连续的重复行)

演示:

1.uniq不加选项,只会对连续的重复行进行去重。

image.png

2.uniq -c,显示连续重复行出现的次数,并合并重复行。 image.png

3.uniq -u,显示仅出现过一次的行(但包括不连续的重复行) image.png

5.echo命令(输出)

echo 命令主要用来显示字符串信息。

命令格式:echo [选项] 字符串

常用的转义符(转义符需结合-e同时使用,且字符串必须加引号):

选项作用
\n插入换行符,输出换行
\r光标移至行首,并且不换行
\s当前shell的名称,如bash
\t插入Tab键(即制表符)
\f换行,但光标仍停留在原处
\ \表示插入\本身
\b插入退格键,表示退格,不显示前一个字符
\c抑制更多的输出或不换行