我正试图从下面的链接中抓取运动日程数据
https://sport-tv-guide.live/live/darts
我在下面使用以下代码
import requests
from bs4 import BeautifulSoup
def makesoup(url):
page=requests.get(url)
return BeautifulSoup(page.text,"lxml")
def matchscrape(g_data):
for match in g_data:
datetimes = match.find('div', class_='main time col-sm-2 hidden-xs').text.strip()
print("DateTimes; ", datetimes)
print('-' *80)
def matches():
soup=makesoup(url = "https://sport-tv-guide.live/live/darts")
matchscrape(g_data = soup.findAll("div", {"class": "listData"}))
我遇到的问题是只返回第一个结果(见下文)
而应该输出两个值(见下文)
我打印了从运行中收到的输出
def matches():
soup=makesoup(url = "https://sport-tv-guide.live/live/darts")
matchscrape(g_data = soup.findAll("div", {"class": "listData"}))
并且由于某种原因似乎只有第一个结果在 HTML 中返回(见下文),这将导致为什么只返回第一个结果,因为这是可以从收到的 HTML 中找到的唯一结果。我不确定的是为什么 Beautifulsoup 没有输出整个 HTML,所以所有的结果都可以输出?
慕村225694
江户川乱折腾
陪伴而非守候
哈士奇WWW
相关分类