python实战:提取.docx文件中的图片转为pptx文件

255 阅读1分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第2天,点击查看活动详情

一、需导入的python库

image.png

安装pptx库

  • 首先需要安装wheel库,安装命令如下:

image.png

  • 然后需要下载对应版本的lxml.whl文件,点击查看下载网址,我使用的python版本是3.7,windows是64位,下载的文件版本如下图:

image.png

  • 文件下载到python安装路径下的scripts文件夹下,我使用到的是虚拟环境,同理存放到scripts文件夹下(也可以存放到任意位置,然后再进入存放文件所在的文件中执行安装命令即可)

image.png

执行python-pptx安装命令

image.png

安装docx库

  • 执行python-docx安装命令

image.png

二、从docx文件中提取图片

  • 从指定docx文件中提取图片存储到指定文件夹中,按照文档流的顺序对图片进行命名,提取函数代码如下:

image.png

三、将多个图片转化为pptx

  • 利用pptx库创建ppt实例对象,设置ppt的页面参数(宽度、高度、上下左右的编剧),在将指定文件夹中的图片按照命名顺序依次添加到ppt页面中,ppt名称为文件夹名称,转换函数代码如下:

image.png

四、实操

之所以编写这段代码时为了处理软考讲义,因为讲义为docx文件,每一个页面以图片的形式存储到docx文件中,我想得到ppt版本的讲义,操作代码如下:

image.png

image.png

image.png