我之前曾在 Python 中进行过少量的网络抓取工作,但我被困在一个可能相当简单的问题上。
我想从这个页面上的表格中获取费率。
我可以获得诸如单个元素或所有费率之类的信息(因为它们都列在“fccu__slash”类下,但我无法弄清楚如何以可用格式逐行获取结果。
这是我的代码的相关部分:
FCCU_url = "https://www.fccu.org/Rates/CD-Rates"
FCCU_resp = requests.get(FCCU_url, timeout=3)
FCCU_soup = BeautifulSoup(FCCU_resp.content, "html.parser")
for elem in FCCU_soup.find_all("td"):
try:
print(elem.contents[0])
except IndexError:
print(elem.contents)
这会输出我想要的所有信息,但不是可用格式。
理想情况下,我希望能够只用我感兴趣的术语抓取 CD,并以这样的格式输出结果(我只关心费率而不是 APY):
['3 Month', '0.65%', '0.75%']
['6 Month', '1.44%', '1.59%']
['2 Year', '2.37%', '2.62%']
这些不是我关心的具体内容,但是一旦我了解了如何去做,我就想自己进行调整。
提前感谢您的任何帮助。
相关分类