pdf转txt后打开乱码

来源:2-4 抽取PDF文档文本内容

慕村1348781

2019-11-22 15:42

http://img3.mukewang.com/5dd7912e00019cc216670983.jpg

http://img.mukewang.com/5dd7912e0001820516690972.jpg

用各种文本编辑器打开都是乱码,是哪里设置不对吗?

写回答 关注

1回答

  • 慕村1348781
    2019-11-26 13:02:52

    问题还是我自己通查多方资料解决了,案例中不管是pdf文件还是doc文件,都是打开word软件转格式,所以最关键的就是一个能打开pdf格式的word版本,我使用word2016可行。代码也没问题。如果运行后txt显示乱码,建议更换office版本到2016。

    洛杉矶鸡腿学... 回复weixin...

    完全没问题了,就是因为OFFICE内部插件问题,我试过OFFICE2016就可以实现,之前用office2007不能够成功了。

    2022-07-19 10:20:40

    共 2 条回复 >

Python数据预处理(一)一抽取多源数据文本信息

Python数据预处理---人工智能通用技术

15975 学习 · 40 问题

查看课程

相似问题