一、linux中常用的文本处理命令

1.tr命令（删除、替换、压缩）

tr命令是用于标准输入的字符进行替换、压缩和删除。

命令格式：tr [选项]...SET1 [SET2]

常用选项：

选项	作用
-c	保留字符集1的字符，其他字符包括换行符\n用字符集2替换
-d	删除所有属于字符集1的字符
-s	将连续重复的字符串压缩成一个
-t	字符集2 替换字符集1，不加选项效果相同

演示：

1.不加任何选项的情况下替换指定的字符。

[root@localhost zhu]# echo "hello linux" |tr he 11     //将he替换成11
11llo linux


[root@localhost zhu]# cat /etc/issue          
\S
Kernel \r on an \m
[root@localhost zhu]# cat /etc/issue |tr [a-z] [A-Z]  //把/etc/issue下的文件全部改成大写。
\S
KERNEL \R ON AN \M



[root@localhost zhu]# echo "192.168.83.101" |tr '.' ' '   //将所有.替换成空格
192 168 83 101

2.-d，删除指定的字符。

[root@localhost zhu]# echo hello linux        
hello linux
[root@localhost zhu]# echo "hello linux" |tr -d "un"   //删除指定un的字符
hello lix
[root@localhost zhu]# echo "hello linux" |tr -d " "    //删除空格
hellolinux

3.-s，将连续重复的字符串压缩成一个。

[root@localhost zhu]# tr -s 1    //将连续的1压缩成一个
11111
1
121212
121212
112211
1221
[root@localhost zhu]# echo "hello linux" |tr -s l     //将连续的l压缩成一个
helo linux

面试题随机生成密码。 tr -dc "字符集1"：符合字符集1的部分不做处理，其他字符进行删除。/dev/urandom可随机生成编码

[root@localhost zhu]# cat /dev/urandom |tr -dc '[:alnum:]'|head -c12    
GsIzTxVl30L4[root@localhost zhu]# 
[root@localhost zhu]# cat /dev/urandom |tr -dc '[:alnum:]'|head -c12

2.seq命令打印数字

命令格式：seq [选项]... 尾数

选项	说明
-s	指定分隔符

演示：

1.-s指定分隔符，默认分隔符为“$”换行符. 2.可以结合bc来算出结果

3.cut命令（取列截取字段或字符串）

用于显示行中的指定部分，删除文件中指定字段。、

命令格式：cut [选项] 参数 常用选项：

选项	作用
-d	指定分隔符（默认分隔符为Tab）
-f n	按字段进行截取。指定第n个字段；1-3表示从第1个字段到第3个字段；1,4,7表示第1、第4、第7个字段
-b	以字节为单位进行截取
-c	以字符为单位进行截取
–complement	排除所指定的字段
–output-delimiter	更改输出内容的分隔符

演示：

1.-d 指定分隔符，-f 按字段进行截取。

2.cut命令无法将连续的字符当做分隔符所以要和tr配合使用。

3.也可以根据字符数来查找

4.–complement，排除所指定的字段。

5.–output-delimiter，更改输出内容的分隔符。

4.sort命令（排序）

sort将文件的每一行作为一个单位相互比较，比较原则是从首字符向后依次按ASCII码进行比较，最后将它们按升序输出。（以行为单位来排序输出）

命令格式：sort [选项] 参数 常用选项：

常用选项	作用
-n	按照数字进行排序（默认升序）
-r	反向排序（倒序）
-u	等同于uniq，表示相同的数据仅显示一行
-t	指定字段分隔符，默认使用Tab键分隔
-k	指定排序字段（不指定则默认第一个字段）
-f	忽略大小写，会将小写字母都转换为大写字母来进行比较
-b	忽略每行前面的空格
-o <输出文件>	将排序后的结果转存到指定文件中

演示：

1.先准备一个文件，每行随意填写数字，sort不加任何选项，默认先按照按首字母排序，随后再按照第二个字母进行排序。

2.-n，按照数字排序。

3.-nr，按照数字倒序排序。

4.-u，合并重复行，相同数据只显示一行。

5.uniq命令（去重）

uniq命令用于报告或者忽略文件中连续的重复行，常与sort命令结合使用。

命令格式：uniq [选项] 参数

常用选项：

常用选项	作用
-c	统计连续重复的行的次数，并且合并重复的行
-u	显示仅出现一次的行（包括不连续的重复行）
-d	仅显示重复出现的行（必须是连续的重复行）

演示：

1.uniq不加选项，只会对连续的重复行进行去重。

2.uniq -c，显示连续重复行出现的次数，并合并重复行。

3.uniq -u，显示仅出现过一次的行（但包括不连续的重复行）

5.echo命令（输出）

echo 命令主要用来显示字符串信息。

命令格式：echo [选项] 字符串

常用的转义符（转义符需结合-e同时使用，且字符串必须加引号）：

选项	作用
\n	插入换行符，输出换行
\r	光标移至行首，并且不换行
\s	当前shell的名称，如bash
\t	插入Tab键（即制表符）
\f	换行，但光标仍停留在原处
\ \	表示插入\本身
\b	插入退格键，表示退格，不显示前一个字符
\c	抑制更多的输出或不换行

Linux常用文本处理命令（echo、sort、uniq、tr、cut、split、eval、seq）

一、linux中常用的文本处理命令

1.tr命令 （删除、替换、压缩）

2.seq命令 打印数字

3.cut命令 （取列 截取字段或字符串）

4.sort命令 （排序）

5.uniq命令（去重）

5.echo命令（输出）

1.tr命令（删除、替换、压缩）

2.seq命令打印数字

3.cut命令（取列截取字段或字符串）

4.sort命令（排序）