星期一,晴
pdfbox对图片的处理速度太慢。
原因:
可能是因为这里面涉及到对图片的编解码功能,所以对于数据大的图片处理很慢
官方文档解释:
BufferedImage | getImage() Returns the content of this image as an AWT buffered image with an (A)RGB color space. |
---|
解决:
- 使用多线程,最简单直接
- 看看是否能跳过其中的编解码工作
- 找一找其他的工具
1.使用多线程
我用的是线程池。
速度提升上去了,处理相同的文件,从原来的55s---->25s左右。但是平均一张图片还是1s
2.跳过pdxObject instanceof PDImageXObject,直接对pdxObject进行操作
这个明天测试