猿问

处理 TIF 文件——将此转换从 ImageMagick 转换为 Java

我正在尝试将 PDF 预处理为 OCR 的 TIF 图像。在命令行上,我可以通过使用以下 ImageMagick 命令将 PDF 转换为 TIF 来完成此操作:

$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff

我怎样才能在 Java 中获得等效的结果?我目前可以使用 tess4j 将 PDF 转换为 TIF,但是如何重新缩放和预处理生成的 tif?哪些库可以让我快速轻松地做到这一点?


炎炎设计
浏览 155回答 1
1回答

达令说

弄清楚了。与其尝试学习另一个图像预处理库,我只是使用im4java来扭曲 IM 命令行,然后直接将命令翻译成以下内容:    ConvertCmd cmd = new ConvertCmd();    IMOperation op = new IMOperation();    op.addImage(imagePath);    op.density(300);    op.depth(8);    op.strip();    op.background("white");    op.alpha("off");    try {        cmd.run(op);    } catch (IOException e) {        e.printStackTrace();    } catch (InterruptedException e) {        e.printStackTrace();    } catch (IM4JavaException e) {        e.printStackTrace();    }
随时随地看视频慕课网APP

相关分类

Java
我要回答