问答详情
源自:5-5 python读取PDF文档(二)

get_text属性出现的有些突然。。。

for out in layout:
    # 判断out 中是否穿在get_text属性
    if hasattr(out,'get_text'):
        print(out.get_text())
get_text属性是在处理过程中就默认存在的吗?


提问者:用户Leon 2018-05-24 13:55

个回答

  • lenaLJX
    2018-07-19 17:04:02

    get_text()是为了获取文本的内容layout是获取了整个pdf文档,但需要out来逐条输出文档的内容,就需要get_text()