Python - Beautifulsoup - 从要抓取的列表中传递单个 url

分析链接后，2个链接指向不同布局的不同页面。https://sport-tv-guide.live/live/tennis - 当您获得所有链接时使用此链接，它们指向不同的页面布局。https://sport-tv-guide.live/live/darts - 此页面中的链接指向此布局。如果您需要从https://sport-tv-guide.live/live/tennis的所有链接中抓取数据，可以使用以下脚本。import requestsfrom bs4 import BeautifulSoupdef makesoup(url):    cookies = {'mycountries' : '101,28,3,102,42,10,18,4,2'}    print(url)    r = requests.post(url,  cookies=cookies)    return BeautifulSoup(r.text,"lxml")   def linkscrape(links):    baseurl = "https://sport-tv-guide.live"    urllist = []        for link in links:        finalurl = baseurl + link['href']        urllist.append(finalurl)            for singleurl in urllist:        soup2=makesoup(url=singleurl)        g_data=soup2.find('div', {'class': 'eventData'})        try:            teams = g_data.find_all("div", class_=["row","mb-5"])                        print("HomeTeam - {}".format(teams[0].find("div", class_="main col-md-8 col-wrap").text.strip()))            print("AwayTeam - {}".format(teams[1].find("div", class_="main col-md-8 col-wrap").text.strip()))            channelInfo = g_data.find("div", {"id":"channelInfo"})            print("Time - {}".format(channelInfo.find("div", class_="time full").text.strip()))            print("Date - {}".format(channelInfo.find("div", class_="date full").text.strip()))        except :            print("Data not found")def matches():    soup=makesoup(url = "https://sport-tv-guide.live/live/tennis")    linkscrape(links=soup.find_all('a', {'class': 'article flag',  'href' : True}))matches()注意：我已经放了try/except，因为从页面获得的链接没有相同的布局。输出：https://sport-tv-guide.live/live/tennishttps://sport-tv-guide.live/event/live-tennis-national-tennis-centre-roehampton?uid=191007191100Data not foundhttps://sport-tv-guide.live/event/bett1-aces-berlin/?uid=71916304HomeTeam - Tommy Haas - Roberto Bautista-AgutAwayTeam - Dominic Thiem - Jannik SinnerTime - 11:15Date - Sunday, 07-19-2020https://sport-tv-guide.live/event/bett1-aces-berlin/?uid=71916307HomeTeam - Tommy Haas - Roberto Bautista-AgutAwayTeam - Dominic Thiem - Jannik SinnerTime - 14:00Date - Sunday, 07-19-2020https://sport-tv-guide.live/event/bett1-aces-berlin/?uid=17207191605HomeTeam - Tommy Haas - Roberto Bautista-AgutAwayTeam - Dominic Thiem - Jannik SinnerTime - 14:05Date - Sunday, 07-19-2020https://sport-tv-guide.live/event/world-teamtennis/?uid=161707191630102Data not found

Python - Beautifulsoup - 从要抓取的列表中传递单个 url

1回答