文本三剑客之sed编辑器

151 阅读5分钟

sed编辑器

sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。

sed编辑器可以根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么储存在一个命令文本文件中。 sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。

sed的工作流程

sed的工作流程主要包括读取.执行和显示三个过程:

  • 读取: sed从输入流 (文件、管道、标准输入) 中读取一行内容并存储到临时的缓冲区中(又称模式空间,pattern space )。

  • 执行: 默认情况下,所有的sed命令都在模式空间中顺序地执行,除非指定了行的地址,否则sed命令将会在所有的行上依次执行。

  • 显示: 发送修改后的内容到输出流。在发送数据后,模式空间将会被清空。在所有的文件内容都被处理完成之前,上述过程将重复执行, 直至所有内容被处理完。

在所有的文件内容都被处理完成之前,上述过程将重复执行,直至所有内容被处理完

(注意:默认情况下所有的sed命令都是在模式空间内执行的,因此输入的文件并不会发生任何变化,除非使用"sed -i"修改源文件、或使用重定向输出到新的文件中。)

命令格式

sed -e '操作' 文件1 文件2   
sed -n -e '操作' 文件1 文件2   
sed -f 脚本文件 文件1 文件2   
sed -i -e '操作' 文件1 文件2

执行多条命令的方法

sed -n -e '操作1' -e '操作2' 文件
 ​ 
sed -n -e '操作1;操作2' 文件
 ​ 
sed -e 'n{  
操作1  
操作2  
......  
}' 文件1 文件2

常用选项

-e 或--expression=:表示用指定命令来处理输入的文本文件,只有一个操作命令时可省略,一般在执行多个操作命令使用
-f 或--file=:表示用指定的脚本文件来处理输入的文本文件。
-h 或--help:显示帮助。
-n、--quiet 或 silent:禁止sed编辑器输出,但可以与p命令一起使用完成输出。
-i:直接修改目标文本文件。

常用操作

s:替换,替换指定字符。
d:删除,删除选定的行。
a:增加,在当前行下面增加一行指定内容。
i:插入,在选定行上面插入一行指定内容。
c:替换,将选定行替换为指定内容。
y:字符转换,转换前后的字符长度必须相同。
p:打印,如果同时指定行,表示打印指定行;如果不指定行,则表示打印所有内容;如果有非打印字符,则以 ASCII 码输出。其通常与“-n”选项一起使用。
=:打印行号。
l(小写L):打印数据流中的文本和不可打印的ASCII字符(比如结束符$、制表符\t) 

查找打印p

-n和-p

打印行号

对指定行进行操作

  1. 以数字形式表示行区间;
  2. 用文本模式(字符串)来过滤出行(一般结合正则表达式)

以数字形式表示行

'1p'打印第一行
'$p'打印最后一行
'1,3p'打印连续行,打印第一行到第三行
'6,$p'打印第六行到最后一行
'1,+3p'打印第一行加后面三行(即打印第一到第四行)
'5q'打印前五行后退出
'p;n'打印奇数行 ('n' :next,读取下一行。'p' :打印当前所在行。)
'n;p'打印偶数行

使用字符串匹配出行

'/root/p'打印包含root的行
'/root/!p'打印不包含root的行。! 表示取反
'/^root/p'打印以root开头的行
'/bash$/'打印以bash结尾的行
'/root l bash/p'打印包含root或bash的行。"l"是扩展正则表达式的元字符,要使用sed -r
'6,/root/p'打印第6行到第一个包含root的行

打印单行

打印连续行

使用正则表达式匹配行内容

sed 使用扩展正则表达式时,要加 -r

sed -r 支持扩展正则表达式。同时在 使用{n}、{n,}、{n,m}时,括号{}前不需要加反斜杠\

删除d

以数字形式表示行区间

通过字符串匹配出想要的行

'/字符串1/,/字符串2/d' :从第一个匹配的位置打开删除功能,到第二个匹配的位置删完后关闭删除功能。之后继续按这个规则向下查找删除。

 删除空行并保存:sed -i '/^$/d' file.txt (使用-i前先备份目标文件)

删除空行的方法

grep -v "^$" file.txt //过滤出非空行
cat file.txt |tr -s "\n" //压缩换行符
sed '/^$/d' file.txt //删除空行

 修改替换 s c y

s:替换字符串

c:整行替换

y:字符替换,替换前后的字符串长度必须相同

替换字符串s

格式

行范围 s/旧字符串/新字符串/替换标记

#4种替换标记:
 数字:表明新字符串将替换第几处匹配的地方
 g:表面新字符串将会替换所有匹配的地方
 p:打印与替换命令匹配的行,与-n一起使用
 w 文件:将替换的结果写入文件中

将包含root内容的行进行注释:

用正则表达式匹配包含root的整行内容,之后在整行内容前加#。&代表前面使用正则表达式匹配到的整行内容。

-f 指定脚本文件来执行

可以在文件中定义多条操作规则

指定分隔符

当字符串中包含"/"时,需要在前面加上转义符\,避免和分隔符"/"混淆。这样操作非常麻烦,且容易眼花看错,此时可以自己指定分隔符。

s后面的第一个字符就是分隔符,3个分隔符要保持一致,如果遇到跟分隔符相同的字符需要使用 \ 转义成普通字符。

整行替换 c

使用c进行替换,是对整行内容进行替换

单字符替换 y

使用y,是对单个字符进行替换,每个字符需要一一对应,不是整体替换。前后字符串长度需要一致,不然会报错。

增加 a i r

a:在行后添加内容

i:在行前插入内容

r:在行后读入文件内容

在行后添加内容

在行前插入内容

在行后读入内容

复制粘贴

H复制、d删除、G粘贴到指定行下方

文件内容中的字符串进行互换