wc.gencache.EnsureDispatch('Word.Application')
这样试试呢,wps可以调用,pdf我没试过
在资料里点击下载
在百度上下载呢
可以的,讲得很基础了,
这个原理上就是调用word的api 所以会自动打开你电脑上的word,貌似没有word还会报错的
我觉得你是切割文件名和后缀的时候,splitext写成split导致的。
是的,就是前两节合成了这个
我碰到的类似问题,是IF循环有问题,直接return了
对的 我也出现过 ,怎么弄呢?
func是指传递进来的Files2txt方法
后面资料下载有哦
很简单,文件->另存为->编码->UTF-8 这样能看明白么?
# 导入 ExtractTxt import ExtractTxt as ET # __main__ 方法创建 TravseralFun 对象时,传入了 Files2Txt 方法 # 而且在 __init__ 方法处,声明了传入了这个方法(起了个别名) # 所以后面调用 func 方法实际上是调用 ExtractTxt 中的 Files2Txt 方法
不知道理解的对不对
用专门处理word的库,读取的内容直接写入txt不会乱码
但是不知道怎么使用呀,有什么安装和使用文档之类的吗?因为我也是刚入门python的而已
问题还是我自己通查多方资料解决了,案例中不管是pdf文件还是doc文件,都是打开word软件转格式,所以最关键的就是一个能打开pdf格式的word版本,我使用word2016可行。代码也没问题。如果运行后txt显示乱码,建议更换office版本到2016。