使用 BeautifulSoup 抓取没有唯一标识符的元素

我之前曾在 Python 中进行过少量的网络抓取工作，但我被困在一个可能相当简单的问题上。

我想从这个页面上的表格中获取费率。

我可以获得诸如单个元素或所有费率之类的信息（因为它们都列在“fccu__slash”类下，但我无法弄清楚如何以可用格式逐行获取结果。

这是我的代码的相关部分：

FCCU_url = "https://www.fccu.org/Rates/CD-Rates"

FCCU_resp = requests.get(FCCU_url, timeout=3)

FCCU_soup = BeautifulSoup(FCCU_resp.content, "html.parser")

for elem in FCCU_soup.find_all("td"):

try:

print(elem.contents[0])

except IndexError:

print(elem.contents)

这会输出我想要的所有信息，但不是可用格式。

理想情况下，我希望能够只用我感兴趣的术语抓取 CD，并以这样的格式输出结果（我只关心费率而不是 APY）：

['3 Month', '0.65%', '0.75%']

['6 Month', '1.44%', '1.59%']

['2 Year', '2.37%', '2.62%']

这些不是我关心的具体内容，但是一旦我了解了如何去做，我就想自己进行调整。

提前感谢您的任何帮助。

侃侃无极

浏览 232回答 3