将pdf转换为带有颜色的文本

我正在尝试将 pdf 转换为文本,并提取文本的颜色信息。

我正在尝试在 golang 中执行此操作,但是使用我从 golang 调用的命令行工具是绝对可以接受的。

我从 中找到pdftotextpoppler-utils,它几乎完美。只是,它没有给我颜色信息。

我试过 github.com/ledongthuc/pdf,它也没有给我颜色信息。

还有其他工具吗?我是否错过了使用 pdftotext 执行此操作的方法?


紫衣仙女
浏览 165回答 1
1回答

慕盖茨4494581

有一个名为poppler( https://poppler.freedesktop.org ) 的 C++ 库,它允许从 PDF 文件中提取文本,包括颜色。这里有一个 go 绑定:https ://github.com/cheggaaa/go-poppler
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Go