Linux常用的文本处理命令

308 阅读5分钟

1、echo命令——输出

echo 命令主要用来显示字符串信息。

语法格式:

 echo 【选项] 字符串
复制代码

常用选项:

 echo -n   表示不换行输出
 echo -e   表示输出转义符(字符串必须加引号,转义符才生效)
复制代码

常用的转义符(转义符需结合-e同时使用,且字符串必须加引号):

选项作用
\n插入换行符,输出换行
\r光标移至行首,并且不换行
\s当前shell的名称,如bash
\t插入Tab键(即制表符)
\f换行,但光标仍停留在原处
\ \表示插入\本身
\b插入退格键,表示退格,不显示前一个字符
\c抑制更多的输出或不换行

关于换行符的小贴士:

 echo -n
 echo -e  "XXXXXX\c"
 #除了以上两种方式输出的内容结尾不会携带换行符,echo其它输出方法都会默认携带一个换行符\n
[root@localhost djq]# echo "helloword"
helloword
[root@localhost djq]# echo -e "hell\noword"  //插入换行符,即输出换行
hell
oword
[root@localhost djq]# echo -e "hell\toword"  //插入制表符
hell	oword
[root@localhost djq]# echo -e "hell\oword"  //插入\本身
hell\oword
[root@localhost djq]# echo -e "hell\boword"  //退格一次
heloword
[root@localhost djq]# echo -e "hell\b\boword"  //退格两次
heoword
[root@localhost djq]# echo -n "helloword"  //内容结尾不会携带换行符
helloword[root@localhost djq]# 
[root@localhost djq]# echo -n "helloword\c"  //内容结尾不会携带换行符
helloword\c[root@localhost djq]# 

echo.png

2、sort命令——排序

sort将文件的每一行作为一个单位相互比较,比较原则是从首字符向后依次按ASCII码进行比较,最后将它们按升序输出。(以行为单位来排序输出)

语法格式:

 sort [选项]  参数
 ​
 cat file | sort 选项
复制代码

常用选项:

常用选项作用
-n按照数字进行排序(默认升序)
-r反向排序(倒序)
-u等同于uniq,表示相同的数据仅显示一行
-t指定字段分隔符,默认使用Tab键分隔
-k指定排序字段(不指定则默认第一个字段)
-f忽略大小写,会将小写字母都转换为大写字母来进行比较
-b忽略每行前面的空格
-o <输出文件>将排序后的结果转存到指定文件中
[root@localhost djq]# cat 1.txt
1
2
3
4
5
8
9
45
12
314
54
21
19
[root@localhost djq]# sort 1.txt 
1
12
19
2
21
3
314
4
45
5
54
8
9

首字母.png

[root@localhost djq]# sort -n 1.txt 
1
2
3
4
5
8
9
12
19
21
45
54
314

默认.png

[root@localhost djq]# sort -n 1.txt 
1
2
3
4
5
8
9
12
19
21
45
54
314
[root@localhost djq]# sort -r 1.txt 
9
8
54
5
45
4
314
3
21
2
19
12
1
[root@localhost djq]# sort -nu 1.txt 
1
2
3
4
5
8
9
12
19
21
45
54
314

-n.png

-r.png

-nu.png

3、uniq命令——去重

uniq命令用于报告或者忽略文件中连续的重复行,常与sort命令结合使用。

语法格式:

 uniq [选项] 参数
 ​
 cat file | uniq 选项
复制代码

常用选项:

常用选项作用
-c统计连续重复的行的次数,并且合并重复的行
-u显示仅出现一次的行(包括不连续的重复行)
-d仅显示重复出现的行(必须是连续的重复行)

示例:

[root@localhost djq]# uniq 1.txt 
1
2
3
4
5
8
9
45
12
314
54
21
19
[root@localhost djq]# uniq -c 1.txt 
      1 1
      1 2
      1 3
      1 4
      1 5
      1 8
      1 9
      1 45
      1 12
      1 314
      1 54
      1 21
      1 19
[root@localhost djq]# uniq -u 1.txt 
1
2
3
4
5
8
9
45
12
314
54
21
19

uniq.png

-c.png

-u.png

4、tr命令——删除、替换、压缩

tr命令常用来对来自标准输入的字符进行替换、压缩和删除。

命令格式:

 cat file | tr [选项]  参数
复制代码

常用选项:

选项作用
-c保留字符集1的字符,其他字符包括换行符\n用字符集2替换
-d删除所有属于字符集1的字符
-s将连续重复的字符串压缩成一个
-t字符集2 替换 字符集1,不加选项效果相同

常用参数

参数说明
字符集1指定要转换或删除的原字符集。当执行转换操作时,必须使用参数“字符集2”指定转换的目标字符集。但执行删除操作时,不需要参数“字符集2”
字符集2指定要转换成的目标字符集
[root@localhost djq]# echo abc | tr 'a-z' 'A-Z'
ABC
[root@localhost djq]# echo abc | tr 'a' 'A'
Abc

替换大写.png

[root@localhost djq]# echo "hello world" | tr -d " "
helloworld
[root@localhost djq]# echo "hhhi woorld" | tr -s "ho"
hi world

-d -s.png

5. cut命令——截取字段或字符串

用于显示行中的指定部分,删除文件中指定字段。

命令格式:

cut [选项] 参数

cat file | cut [选项] 参数
复制代码

常用选项:

选项作用
-d指定分隔符(默认分隔符为Tab)
-f n按字段进行截取。指定第n个字段;1-3表示从第1个字段到第3个字段;1,4,7表示第1、第4、第7个字段
-b以字节为单位进行截取
-c以字符为单位进行截取
–complement排除所指定的字段
–output-delimiter更改输出内容的分隔符
[root@localhost ~]# cut -d ":" -f 1 /etc/passwd
root
bin
daemon
adm
lp
sync
shutdown
halt
mail
operator
games
ftp
nobody
systemd-network
dbus
polkitd
abrt
libstoragemgmt
rpc
colord
saslauth
setroubleshoot
rtkit
pulse
qemu
ntp
radvd

-d -f.png

[root@localhost ~]# head -5 /etc/passwd | cut -d ":" -f 1-3,6
root:x:0:/root
bin:x:1:/bin
daemon:x:2:/sbin
adm:x:3:/var/adm
lp:x:4:/var/spool/lpd

-f.png

6、split命令——拆分文件

split命令用于在Linux下将大文件拆分为若干小文件。

语法格式:

 split 选项 参数 原始文件 拆分后文件名前缀
复制代码

常用选项:

选项作用
-l指定行数
-b指定大小

image.png

7、eval命令——扫描命令2次

命令字前加上eval,shell会在执行命令之前扫描它两次,eval命令首先会先扫描命令行进行所有的置换,然后再执行命令,该命令适用于那些一次扫描无法实现功能的变量,该命令会对变量进行两次扫描

[root@localhost ~]# echo "hello world">file
[root@localhost ~]# cat file
hello world
[root@localhost ~]# myfile="cat file"
[root@localhost ~]# echo $myfile   //输出变量myfile的值
cat file
[root@localhost ~]# eval $myfile   //扫描命令2次,先将myfile置换成"cat file",之后执行"cat file"
hello world

扫描两次.png