我试过这段代码,但带有 URL 的列表仍然是空的。没有错误按摩,什么都没有。
from bs4 import BeautifulSoup
from urllib.request import Request, urlopen
import re
req = Request('https://www.metacritic.com/browse/movies/genre/date?page=0', headers={'User-Agent': 'Mozilla/5.0'})
html_page = urlopen(req).read()
soup = BeautifulSoup(html_page, features="xml")
links = []
for link in soup.findAll('a', attrs={'href': re.compile("^https://www.metacritic.com/movie/")}):
links.append(link.get('href'))
print(links)
我想刮以“开头的所有网址https://www.metacritic.com/movie/ ”这是在给定的URL“发现https://www.metacritic.com/browse/movies/genre/date?页=0 “。
我究竟做错了什么?
慕容3067478
相关分类