我有如下的汤数据。
<a href="/title/tt0110912/" title="Quentin Tarantino">
Pulp Fiction
</a>
<a href="/title/tt0137523/" title="David Fincher">
Fight Club
</a>
<a href="blablabla" title="Yet to Release">
Yet to Release
</a>
<a href="something" title="Movies">
Coming soon
</a>
我需要这些标签中的文本数据a,也许href=/title/*wildcharacter*
我的可能看起来像这样。
titles = []
for a in soup.find_all("a",href=True):
if a.text:
titles.append(a.text.replace('\n'," "))
print(titles)
但是在这种情况下,我会从所有a标签中获取文本。我只需href要有"/title/***".
守着一只汪
三国纷争
慕哥9229398
相关分类