python实现对doc、txt、xls等文档的读写操作

226 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

python实现对doc、txt、xls等文档的读写操作

1.python实现对doc文档的读取

 #读取docx中的文本代码示例
 import docx
 #获取文档对象
 file=docx.Document("path")
 print("段落数:"+str(len(file.paragraphs)))#段落数为13,每个回车隔离一段
 ​
 #输出每一段的内容
 for para in file.paragraphs:
     print(para.text)
 ​
 #输出段落编号及段落内容
 for i in range(len(file.paragraphs)):
     print("第"+str(i)+"段的内容是:"+file.paragraphs[i].text)
 ​

2.python实现对txt文档的读取

 filename = 'tangqing.txt' # txt文件和当前脚本在同一目录下,所以不用写具体路径
 pos = []
 Efield = []
 with open(filename, 'r') as file_to_read:
   while True:
     lines = file_to_read.readline() # 整行读取数据
     if not lines:
       break
     p_tmp= [float(i) for i in lines.split()] # 将整行数据分割处理,如果分割符是空格,括号里就不用传入参数,如果是逗号, 则传入‘,'字符。
     pos = np.array(p_tmp) # 将数据从list类型转换为array类型。
     print(pos)

3.python实现对xls表格的读取

 import  xdrlib ,sys
 import xlrd
 def open_excel(file= 'path'):
     try:
         data = xlrd.open_workbook(file)
         return data
     except Exception as e:
         print(str(e))
 ​
 #根据索引获取Excel表格中的数据   参数:file:Excel文件路径     colnameindex:表头列名所在行的索引  ,by_index:表的索引
 def excel_table_byindex(file= 'path/xxx.xls',colnameindex=0,by_index=0):
     data = open_excel(file)
     table = data.sheets()[by_index]
     nrows = table.nrows #行数
     ncols = table.ncols #列数
     colnames =  table.row_values(colnameindex) #某一行数据 
     list =[]
     for rownum in range(1,nrows):
          row = table.row_values(rownum)
          if row:
              app = {}
              for i in range(len(colnames)):
                 app[colnames[i]] = row[i] 
              list.append(app)
     return list
 ​
 #根据名称获取Excel表格中的数据   参数:file:Excel文件路径     colnameindex:表头列名所在行的所以  ,by_name:Sheet1名称
 def excel_table_byname(file= 'E:\个人文件\6-desktop\丰沙点表-配电所.xls',colnameindex=0,by_name=u'电度'):
     data = open_excel(file)
     table = data.sheet_by_name(by_name)
     nrows = table.nrows #行数 
     colnames =  table.row_values(colnameindex) #某一行数据 
     list =[]
     for rownum in range(1,nrows):
          row = table.row_values(rownum)
          if row:
              app = {}
              for i in range(len(colnames)):
                 app[colnames[i]] = row[i]
              list.append(app)
     return list
 ​
 def main():
    tables = excel_table_byindex()
    for row in tables:
        print(row)
            
 ​
    tables = excel_table_byname()
    for row in tables:
        print(row)
            
 ​
 if __name__=="__main__":
     main()
 ​

\