从维基百科页面抓取表数据

要打印表格的第一列，您可以迭代行 ( <tr>)，然后获取行 ( <td>) 的所有单元格。每行的第一个单元格是您的爵士乐流派：import requestsfrom bs4 import BeautifulSoupurl = 'https://en.wikipedia.org/wiki/List_of_jazz_genres'soup = BeautifulSoup(requests.get(url).content, "html.parser")table = soup.find_all("table")[1]for row in table.find_all('tr')[1:]:    # <-- [1:] because we don't want the header    cells = [td.get_text(strip=True) for td in row.find_all('td')]    print(cells[0])印刷：Acid jazzAfro-Cuban jazzAvant-garde jazzBebopBossa novaBritish dance bandCape jazzChamber jazzContinental jazzCool jazzCrossover jazzDark jazz/Doomjazz[1][2][3]DixielandElectro SwingEthio jazzEthno jazzEuropean free jazzFree funkFree jazzFrevoGypsy jazzHard bopHot clubIndo jazzJazz bluesJazz-funkJazz fusionJazz rapJazz rockKansas City bluesKansas City jazzLatin jazzM-BaseMainstream jazzModal jazzNeo-bop jazzNeo-swingNeo-bop jazzNovelty ragtimeNu jazzOrchestral jazzPost-bopPunk jazzRagtimeSka jazzSmooth jazzSoul jazzStraight-ahead jazzStride jazzSwingThird streamTrad jazzVocal jazzWest Coast jazz

从维基百科页面抓取表数据

2回答