Python 操作 Word 文件

438 阅读1分钟

要操作 Word 文件,我们需要使用一个 Python 的第三方库叫做 python-docx。它可以让我们使用 Python 对 Word 文件进行读取、修改以及创建等操作。

安装

你可以使用 pip 命令来安装 python-docx 库:

pip install python-docx

读取 Word 文件

我们可以使用 docx.Document() 函数来打开一个 Word 文档。下面是一个简单的例子:

import docx

document = docx.Document('demo.docx')

这里把 demo.docx 文档打开,并赋值给变量 document

我们可以使用 paragraphs 属性来访问文档中所有的段落。下面是一个例子:

for para in document.paragraphs:
    print(para.text)

这里使用了一个 for 循环来遍历文档中的每一个段落,并打印出它们的文本内容。

修改 Word 文件

我们可以使用 paragraphrun 对象来修改文档中的内容。paragraph 对象代表一个段落,而 run 对象代表一个文本块。

下面是一个简单的例子,它会把文档中所有的段落内容转换成大写:

for para in document.paragraphs:
    for run in para.runs:
        run.text = run.text.upper()

document.save('new_demo.docx')

这里遍历文档中的每一个段落和文本块,并把它们的文本全部转换成大写。然后使用 save() 函数将更改后的文档保存为新的文件 new_demo.docx

创建 Word 文件

我们可以使用 docx.Document() 函数来创建一个新的 Word 文档。下面是一个例子:

import docx

document = docx.Document()

document.add_heading('Hello, World!', 0)

document.add_paragraph('This is a paragraph.')

document.save('new_doc.docx')

这里使用 add_heading()add_paragraph() 函数来添加一个标题和一个段落。然后使用 save() 函数将文档保存为新的文件 new_doc.docx

这样,我们就学会了使用 Python 操作 Word 文件的基本方法。使用 python-docx 库,可以很方便地读取、修改以及创建 Word 文档。