import RE 无反馈

来源:3-5 获取维基百科词条信息

玖月思慕

2017-11-15 10:08

是RE模块没有下载么,,一直提示下面这个错误,哭唧唧o(╥﹏╥)o  

listUrls = soup.findALL('a', href=re.compile('^wiki'))

TypeError: 'NoneType' object is not callable

用的是 win10+python3.5+pycharm 求大神解答,,o(╥﹏╥)o

写回答 关注

2回答

  • 杰神
    2017-11-16 13:36:45
    #!/usr/bin/env python
    # -*- coding:utf-8 -*-
    import io
    import sys
    from urllib import request
    from bs4 import BeautifulSoup
    import re
    sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')  
    resp = request.urlopen("http://news.baidu.com/").read().decode("utf-8")
    soup =BeautifulSoup(resp,"html.parser")
    listUrls=soup.find_all("a",href=re.compile(".*\/\/news\.baidu.*"))
    for url in listUrls:
    print (url.get_text(),"<------------>"+url["href"])

    这个是我的,你可以参考一下

  • 杰神
    2017-11-16 13:34:52

    RE是自带的,跟sys和io类似,直接import就可以用,是你的正则写错了

    还有你的beautifulSoup如果是最新版,用

    find_all替代findALL

python遇见数据采集

本教程让你初步掌握Python进行数据采集,创造属于你的价值

59669 学习 · 200 问题

查看课程

相似问题