命令格式
[split] [-b ][-l ][-a ][-d ][要切割的文件][输出文件名前缀]
这里列了一些比较常用的的选项:
- -b:指定按多少字节进行拆分,也可以指定 K、M、G、T 等单位。
- -l:指定每多少行要拆分成一个文件。
- -a:后缀长度,默认的后缀长度是 2,也就是按 aa、ab、ac 这样的格式依次编号。
- -d:后缀按数字编码,默认按 aa、ab、ac 这样的格式依次编号
- 输出文件名前缀:设置拆分后的文件的名称前缀,默认以 x 作为前缀。
想要了解更多可以运行split --help查看
按文件大小分割
split -b 100K -a 1 -d test.csv test_b_
按文件行数分割(文本文件)
split -l 5000 -a 2 -d test.csv test_l_
合并文件
文件拆分后,也可以进行合并,命令如下
cat test_l_* > test_copy.csv
校验文件
如果需要在合并文件后进行文件的完整性校验,推荐使用 md5sum 来计算和比对前后两个大文件的 md5 值。