我正在建立一个 java 项目,在其中使用 pdfBox 从 PDF 中获取图像。由于我使用 tika-app 来实现其他功能,因此我决定使用 tika-app-1.20.jar 中的 pdfBox。
我之前尝试过包含 jai-imageio-core-1.3.1.jar,因为 Tika-app 已经与此 jar 捆绑在一起。我尝试单独使用 tika-app jar。
抛出错误的行
PDXObject object = resources.getXObject(cosName);
错误的日志跟踪:
org.apache.pdfbox.filter.MissingImageReaderException: Cannot read JPEG2000 image: Java Advanced Imaging (JAI) Image I/O Tools are not installed
at org.apache.pdfbox.filter.Filter.findImageReader(Filter.java:163)
at org.apache.pdfbox.filter.JPXFilter.readJPX(JPXFilter.java:115)
at org.apache.pdfbox.filter.JPXFilter.decode(JPXFilter.java:64)
at org.apache.pdfbox.cos.COSInputStream.create(COSInputStream.java:77)
at org.apache.pdfbox.cos.COSStream.createInputStream(COSStream.java:175)
at org.apache.pdfbox.cos.COSStream.createInputStream(COSStream.java:163)
at org.apache.pdfbox.pdmodel.common.PDStream.createInputStream(PDStream.java:236)
at org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject.<init>(PDImageXObject.java:140)
at org.apache.pdfbox.pdmodel.graphics.PDXObject.createXObject(PDXObject.java:70)
at org.apache.pdfbox.pdmodel.PDResources.getXObject(PDResources.java:426)
但我很确定我在 tika 中有 jai-imageio-core,当我运行代码时,它是不可见的。
婷婷同学_
富国沪深
相关分类