4.15----调研

7 阅读1分钟

星期一,晴

pdfbox对图片的处理速度太慢。

原因:

可能是因为这里面涉及到对图片的编解码功能,所以对于数据大的图片处理很慢

官方文档解释:

BufferedImagegetImage()Returns the content of this image as an AWT buffered image with an (A)RGB color space.

解决:

  1. 使用多线程,最简单直接
  2. 看看是否能跳过其中的编解码工作
  3. 找一找其他的工具

1.使用多线程

我用的是线程池。

速度提升上去了,处理相同的文件,从原来的55s---->25s左右。但是平均一张图片还是1s

2.跳过pdxObject instanceof PDImageXObject,直接对pdxObject进行操作

这个明天测试