我有一个列出 PDF 文件注释的脚本从 pdf 解析注释:
import popplerqt5
import argparse
def extract(fn):
doc = popplerqt5.Poppler.Document.load(fn)
annotations = []
for i in range(doc.numPages()):
page = doc.page(i)
for annot in page.annotations():
contents = annot.contents()
if contents:
annotations.append(contents)
print(f'page={i + 1} {contents}')
print(f'{len(annotations)} annotation(s) found')
return annotations
if __name__ == '__main__':
parser = argparse.ArgumentParser()
parser.add_argument('fn')
args = parser.parse_args()
extract(args.fn)
但它只适用于文本注释,有很多Python库,如Poppler、PyPDF2、PyMuPDF,我一直在搜索他们的文档和源代码很多,就我而言,他们无法提取声音注释的二进制。你知道有哪个图书馆可以做到这一点吗?我需要提取这些声音注释的二进制文件并将它们转换为 MP3。
qq_花开花谢_0
相关分类