提取两个不同标签之间的文本美丽汤

我正在尝试从此网页中提取文章的文本内容。


我只是在尝试提取文章内容,而不是“关于作者部分”。


问题在于所有内容都不在标记之类<div>。因此我无法提取它们,因为它们都在<p>标记内。当我提取所有<p>标签时,我还将获得“关于作者”部分。我必须从这个网站上抓取许多页面。有没有办法使用美丽的汤来做到这一点?


我目前正在尝试:


p_tags=soup.find_all('p')

for row in p_tags:

    print(row)


千万里不及你
浏览 272回答 3
3回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python