猿问

使用 BeautifulSoup 抓取没有唯一标识符的元素

我之前曾在 Python 中进行过少量的网络抓取工作,但我被困在一个可能相当简单的问题上。


我想从这个页面上的表格中获取费率。


我可以获得诸如单个元素或所有费率之类的信息(因为它们都列在“fccu__slash”类下,但我无法弄清楚如何以可用格式逐行获取结果。


这是我的代码的相关部分:


FCCU_url = "https://www.fccu.org/Rates/CD-Rates"

FCCU_resp = requests.get(FCCU_url, timeout=3)

FCCU_soup = BeautifulSoup(FCCU_resp.content, "html.parser")

for elem in FCCU_soup.find_all("td"):

    try:

        print(elem.contents[0])

    except IndexError:

        print(elem.contents)

这会输出我想要的所有信息,但不是可用格式。


理想情况下,我希望能够只用我感兴趣的术语抓取 CD,并以这样的格式输出结果(我只关心费率而不是 APY):


['3 Month', '0.65%', '0.75%']

['6 Month', '1.44%', '1.59%']

['2 Year', '2.37%', '2.62%']

这些不是我关心的具体内容,但是一旦我了解了如何去做,我就想自己进行调整。


提前感谢您的任何帮助。


侃侃无极
浏览 170回答 3
3回答
随时随地看视频慕课网APP

相关分类

Python
我要回答