如果需要处理 PDF,更推荐使用纯 Python 库(跨平台、无需依赖外部软件):
PyPDF2/PyPDF4:合并、拆分、提取文本、添加水印等基础操作。
pdfplumber:更精准的文本提取(支持复杂排版)。
PyMuPDF(fitz):高效的文本提取、页面操作、转换格式等。
reportlab:生成 PDF 文档(从空白页创建内容)。
综上,win32com 可以间接操控 PDF 软件,但并非处理 PDF 的最优选择,纯 Python 库通常更轻便、高效。
编辑分享
给PDF添加水印的具体操作步骤
如何将PDF转换为Word格式?
怎样使用win32com提取PDF中的图片?
PDF转TXT的算法实现
算法思路:
·定义文件路径和转存路径:split
·修改新的文件名:fnmatch
·设置完整的保存路径:join
·启动应用程序格式转换:Dispatch
·保存文本:SaveAs
转换思路基本一样
from win32com import client as wc
from win32com.client import Dispatch
PDF转TXT的算法实现