一、linux中常用的文本处理命令
1.tr命令 (删除、替换、压缩)
tr命令是用于标准输入的字符进行替换、压缩和删除。
命令格式:tr [选项]...SET1 [SET2]
常用选项:
选项 | 作用 |
---|---|
-c | 保留字符集1的字符,其他字符包括换行符\n用字符集2替换 |
-d | 删除所有属于字符集1的字符 |
-s | 将连续重复的字符串压缩成一个 |
-t | 字符集2 替换 字符集1,不加选项效果相同 |
演示:
1.不加任何选项的情况下替换指定的字符。
[root@localhost zhu]# echo "hello linux" |tr he 11 //将he替换成11
11llo linux
[root@localhost zhu]# cat /etc/issue
\S
Kernel \r on an \m
[root@localhost zhu]# cat /etc/issue |tr [a-z] [A-Z] //把/etc/issue下的文件全部改成大写。
\S
KERNEL \R ON AN \M
[root@localhost zhu]# echo "192.168.83.101" |tr '.' ' ' //将所有.替换成空格
192 168 83 101
2.-d,删除指定的字符。
[root@localhost zhu]# echo hello linux
hello linux
[root@localhost zhu]# echo "hello linux" |tr -d "un" //删除指定un的字符
hello lix
[root@localhost zhu]# echo "hello linux" |tr -d " " //删除空格
hellolinux
3.-s,将连续重复的字符串压缩成一个。
[root@localhost zhu]# tr -s 1 //将连续的1压缩成一个
11111
1
121212
121212
112211
1221
[root@localhost zhu]# echo "hello linux" |tr -s l //将连续的l压缩成一个
helo linux
面试题随机生成密码。 tr -dc "字符集1":符合字符集1的部分不做处理,其他字符进行删除。/dev/urandom可随机生成编码
[root@localhost zhu]# cat /dev/urandom |tr -dc '[:alnum:]'|head -c12
GsIzTxVl30L4[root@localhost zhu]#
[root@localhost zhu]# cat /dev/urandom |tr -dc '[:alnum:]'|head -c12
2.seq命令 打印数字
命令格式:seq [选项]... 尾数
选项 | 说明 |
---|---|
-s | 指定分隔符 |
演示:
1.-s指定分隔符,默认分隔符为“$”换行符.
2.可以结合bc来算出结果
3.cut命令 (取列 截取字段或字符串)
用于显示行中的指定部分,删除文件中指定字段。、
命令格式:cut [选项] 参数
常用选项:
选项 | 作用 |
---|---|
-d | 指定分隔符(默认分隔符为Tab) |
-f n | 按字段进行截取。指定第n个字段;1-3表示从第1个字段到第3个字段;1,4,7表示第1、第4、第7个字段 |
-b | 以字节为单位进行截取 |
-c | 以字符为单位进行截取 |
–complement | 排除所指定的字段 |
–output-delimiter | 更改输出内容的分隔符 |
演示:
1.-d 指定分隔符,-f 按字段进行截取。
2.cut命令无法将连续的字符当做分隔符所以要和tr配合使用。
3.也可以根据字符数来查找
4.–complement,排除所指定的字段。
5.–output-delimiter,更改输出内容的分隔符。
4.sort命令 (排序)
sort将文件的每一行作为一个单位相互比较,比较原则是从首字符向后依次按ASCII码进行比较,最后将它们按升序输出。(以行为单位来排序输出)
命令格式:sort [选项] 参数
常用选项:
常用选项 | 作用 |
---|---|
-n | 按照数字进行排序(默认升序) |
-r | 反向排序(倒序) |
-u | 等同于uniq,表示相同的数据仅显示一行 |
-t | 指定字段分隔符,默认使用Tab键分隔 |
-k | 指定排序字段(不指定则默认第一个字段) |
-f | 忽略大小写,会将小写字母都转换为大写字母来进行比较 |
-b | 忽略每行前面的空格 |
-o <输出文件> | 将排序后的结果转存到指定文件中 |
演示:
1.先准备一个文件,每行随意填写数字,sort不加任何选项,默认先按照按首字母排序,随后再按照第二个字母进行排序。
2.-n,按照数字排序。
3.-nr,按照数字倒序排序。
4.-u,合并重复行,相同数据只显示一行。
5.uniq命令(去重)
uniq命令用于报告或者忽略文件中连续的重复行,常与sort命令结合使用。
命令格式:uniq [选项] 参数
常用选项:
常用选项 | 作用 |
---|---|
-c | 统计连续重复的行的次数,并且合并重复的行 |
-u | 显示仅出现一次的行(包括不连续的重复行) |
-d | 仅显示重复出现的行(必须是连续的重复行) |
演示:
1.uniq不加选项,只会对连续的重复行进行去重。
2.uniq -c,显示连续重复行出现的次数,并合并重复行。
3.uniq -u,显示仅出现过一次的行(但包括不连续的重复行)
5.echo命令(输出)
echo 命令主要用来显示字符串信息。
命令格式:echo [选项] 字符串
常用的转义符(转义符需结合-e同时使用,且字符串必须加引号):
选项 | 作用 |
---|---|
\n | 插入换行符,输出换行 |
\r | 光标移至行首,并且不换行 |
\s | 当前shell的名称,如bash |
\t | 插入Tab键(即制表符) |
\f | 换行,但光标仍停留在原处 |
\ \ | 表示插入\本身 |
\b | 插入退格键,表示退格,不显示前一个字符 |
\c | 抑制更多的输出或不换行 |