获得徽章 0
- 评论24
- 【60行Python代码,实现多线程PDF转Word】
工作中经常会遇到需要提取PDF文件中文字的情况,一个PDF还好,复制粘贴一下也花不了太多时间,如果需要把大量PDF转为Word,怎么办呢?
其实我们只需用60行Python代码就能实现多线程批量PDF转Word。
该程序所有代码已经打包成了一个独立可运行的项目,存放在github,可以直接clone或下载github项目运行。项目地址如下:
github.com
项目作者:simpleapples
教程地址:www.simpleapples.com
展开229 - 【从事图像处理领域的朋友有福了 】
从事机器学习中和图像有关的工作时,通常都需要用到大量的图像数据集,好消息是有个超大超珍贵的免费数据集出现了。
近日美国大都会博物馆(The Met)宣布公开典藏的45万张国宝级数字照片,包括画作图档、历史文物照片,供公众免费下载,教学、研究和商用均可。
进入大都会博物馆网站,点进你感兴趣的图片后,如果右下方出现“Public Domain”的授权,并提供“Download”按钮,就表示可以免费下载,自由使用。
当然,即便不需要用作研究用,喜欢艺术的朋友平时到上面去逛逛,欣赏一下名家的画作也是极好的。
传送门:www.metmuseum.org
展开评论4