提要
在实际操作csv格式的文件时候特别头疼,由于csv格式文件默认是使用逗号分割,这导致csv列的值若是含有逗号则导致读取和解析csv列错乱的情况。为了避免上述情况我们可能更希望csv格式转成使用制表符分割的tsv格式文件。
操作
监测并安装pip
# centos默认安装python2.7
> pip
-bash: pip: command not found
> curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
> sudo python get-pip.py
设置转换脚本并执行
> sudo pip install pandas
> vi script.py
# 配置script脚本(如果报编码问题,去掉这行注释)
import sys
import csv
import pandas as pd
pd_all = pd.read_csv(sys.stdin)
pd_all.to_csv(sys.stdout, sep='\t', header=None, index=False, mode="w")
> python script.py < 待转.csv > 输出.csv