Python读取txt、csv、xlsx、doc、json、parquet等各种数据文件类型方法总结.

82 阅读2分钟

Python是一杯魔法的鸡尾酒,她包含了文本、表格、网页等各色各样的原材料。但这杯鸡尾酒的精髓在于如何将这些原材料有机整合起来。今天,就让我们走进Python的魔法世界,探索如何读取各种数据文件吧。

文本之舞:TXT读取

TXT文件如同舞蹈中的基础步伐,简单但至关重要。使用Python的内置函数 open()就可以轻松掌握这个舞步:

with open("example.txt", "r") as file:
    content = file.read()
print(content)
​

这小段代码流畅而优雅,像是一支华尔兹。我们轻轻地打开文件,赏读其中的内容,然后静静地关闭它。

表格之歌:CSV和XLSX读取

CSV和XLSX文件就像音乐中的节拍,它们用有序且结构化的方式传达信息。Python里表格数据的大师是 pandas库,音乐会现在开始:

import pandas as pd

# For csv, it's like a simple folk song.
df_csv = pd.read_csv('file.csv')

# For xlsx, it's like a symphony with multiple parts(sheets).
xls = pd.ExcelFile('file.xlsx')
df_sheet1 = pd.read_excel(xls, 'Sheet1')
df_sheet2 = pd.read_excel(xls, 'Sheet2')
​

文档之戏:DOC读取

DOC文件是一个戏剧,构想丰富,多变复杂。我们需要借助 python-docx库的魔力来揭开它的神秘面纱:

from docx import Document

doc = Document('example.docx')
for para in doc.paragraphs:
    print(para.text)
​

这些代码如同戏剧的折叠舞台,用高超技艺呈现出层次丰富的场景。

数据雕塑:JSON读取

JSON文件是数据的雕塑,有丰富的结构和细腻的表情。Python的 json库就是我们的雕刻工具:

import json

# Open the sculpture gallery
with open('example.json', 'r') as f:
    data = json.load(f)

print(data)
​

就像雕刻家一笔一划地揭示形体的美,这些代码精确地展示了数据的结构。

大数据之筑:PARQUET读取

PARQUET文件是大数据的城堡,高大且深峻。Python的 pyarrow.parquet库就是我们建筑大数据城堡的石材和工具:

import pyarrow.parquet as pq

# Unveil the grand castle
data_parquet = pq.read_table('example.parquet').to_pandas()

print(data_parquet)
​

如此,即使面对巨大的数据城堡,我们也可以轻松走进。

Python的魔法力量无穷无尽,无论你面对什么样的数据文件,都有相应的方法。只要在Python的魔法书中,你总可以找到解决问题的钥匙。继续探索,你会发现更多未知的世界,让Python的魔法带领你走向数据的魔法世界吧。

云服务器推荐

蓝易云国内/海外高防云服务器推荐

蓝易云-五网CN2服务器【点我购买】

蓝易云采用KVM高性能架构,稳定可靠,安全无忧!
蓝易云服务器真实CN2回国线路,不伪造,只做高质量海外服务器。


海外免备案云服务器链接:www.tsyvps.com

蓝易云香港五网CN2 GIA/GT精品网络服务器。拒绝绕路,拒绝不稳定。