我对一些 pdf 文件有疑问。我需要将它们转换为 jpg 图像,使它们可用于 OCR,但是当我转换其中一些时,Wand 将我转换为 jpg,其中文本上有黑色背景。我看到这是关于空间颜色的常见问题。它似乎发生在文件 word 转换为 pdf 文件的情况下,其中空间颜色变为 CMYK。Tesseract OCR 只接受空间颜色 RGB。我已经编写了一个可以转换的 python 脚本,但我想解决这个问题。你可以帮帮我吗?谢谢。

原始页面 pd将 pdf

转换为 jpg
哔哔one
波斯汪
繁星点点滴滴
随时随地看视频慕课网APP
相关分类