我正在尝试使用美丽的汤从该网站上抓取实时出发表。
我尝试了以下方法:
caremar_live_departures_table = list(soup.select('.table-booking-history tr'))
caremar_live_departures_data = []
for tr in caremar_live_departures_table:
td = tr.select('td')
caremar_live_departures_data.append({
'DEPARTURE PORT': td[1].select('span span').text,
'ARRIVAL PORT': td[2].select('span span').text,
'DEPARTURE TIME': td[4].select('span').text,
'ARRIVAL TIME': td[6].select('span').text,
'FEERY TYPE': td[3].select('span span').text,
'STATUS': td[3].select('span span').text
})
我收到以下错误:
'DEPARTURE PORT': td[1].select('span span').text,
IndexError: list index out of range
td 应该是一个数组,为什么不是这样?
相关分类