import RE 无反馈-慕课网

首页课程实战体系课手记专栏慕课教程

import RE 无反馈

来源：3-5 获取维基百科词条信息

玖月思慕

2017-11-15 10:08

是RE模块没有下载么，，一直提示下面这个错误，哭唧唧o(╥﹏╥)o

listUrls = soup.findALL('a', href=re.compile('^wiki'))

TypeError: 'NoneType' object is not callable

用的是 win10+python3.5+pycharm 求大神解答，，o(╥﹏╥)o

写回答关注

2回答

杰神: 2017-11-16 13:36:45

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import io
import sys
from urllib import request
from bs4 import BeautifulSoup
import re
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8')  
resp = request.urlopen("http://news.baidu.com/").read().decode("utf-8")
soup =BeautifulSoup(resp,"html.parser")
listUrls=soup.find_all("a",href=re.compile(".*\/\/news\.baidu.*"))
for url in listUrls:
print (url.get_text(),"<------------>"+url["href"])

这个是我的，你可以参考一下

0 0

杰神

2017-11-16 13:34:52

RE是自带的，跟sys和io类似，直接import就可以用，是你的正则写错了
还有你的beautifulSoup如果是最新版，用
find_all替代findALL

0 0

python遇见数据采集

本教程让你初步掌握Python进行数据采集，创造属于你的价值

59661 学习 · 209 问题

查看课程

相似问题

from urllib.request import urlopen报错

回答 1

ImportError: cannot import name 'request'

回答 1

from urllib.request import urlopen 运行报错

回答 1

输入这个rom urllib request import urlopen报错了

回答 1

为什么要使用反引号

回答 3

打开慕课网App查看更多内容