pdf转txt的乱码问题

来源:2-4 抽取PDF文档文本内容

jiminie125

2019-09-15 13:29

问题如标题,如何解决pdf转txt的乱码问题;另外pdf转txt时dispatch参数仍然是word.application吗,saveas中参数确定为4吗?4难道不是word转txt的吗

写回答 关注

1回答

  • 慕村1348781
    2019-11-26 13:03:42
    已采纳

    问题还是我自己通查多方资料解决了,案例中不管是pdf文件还是doc文件,都是打开word软件转格式,所以最关键的就是一个能打开pdf格式的word版本,我使用word2016可行。代码也没问题。如果运行后txt显示乱码,建议更换office版本到2016。


Python数据预处理(一)一抽取多源数据文本信息

Python数据预处理---人工智能通用技术

15975 学习 · 40 问题

查看课程

相似问题