我有一张噩梦表,没有为 tr 和 td 标签提供类。
示例页面如下:https ://system.gotsport.com/org_event/events/1271/schedules?age=19&gender=m
(您将在下面的代码中看到我得到了多个页面,但这不是问题。)
我想要每个括号中的团队名称(没有其他名称)。输出应该是:
OCYS
FL Rush
杰克逊维尔 FC
亚特兰大联
SSA
迈阿密拉什 肯德尔 SC
IMG
坦帕湾联
等
我已经能够获取指定表中的每个td 。但是每次尝试[0]
获取td
每一行的第一行都会给我一个“索引超出范围”错误。
代码是:
import requests
import csv
from bs4 import BeautifulSoup
batch_size = 2
urls = ['https://system.gotsport.com/org_event/events/1271/schedules?age=19&gender=m', 'https://system.gotsport.com/org_event/events/1271/schedules?age=17&gender=m']
# iterate through urls
for url in urls:
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
# iterate through leagues and teams
leagues = soup.find_all('table', class_='table table-bordered table-hover table-condensed')
for league in leagues:
row = ''
rows = league.find_all('tr')
for row in rows:
team = row.find_all('td')
teamName = team[0].text.strip()
print(teamName)
经过几个小时的工作后,我觉得只需更改一个语法即可实现这一目标。是的?
波斯汪
慕田峪4524236
炎炎设计
相关分类