我有 html 代码:
<h3 class="s-item__title s-item__title--has-tags" role="text">
<div>
<div class="s-item__title-tag">SOLD Oct 9, 2018</div>
</div>
<span class="LIGHT_HIGHLIGHT">New Listing</span>MAX DELL PRECISION M4800 I7-4930XM EXTREME EDITION 3GHz 16GB 500GB SSD K2100 FHD
</h3>
我想获得“MAX DELL PRECISION M4800 I7-4930XM EXTREME EDITION 3GHz 16GB 500GB SSD K2100 FHD”,但是当我这样做时:
pre_title_and_sold=rel_text.findAll("h3",{"class":"s-item__title s-item__title--has-tags"})
print(pre_title_and_sold)
我得到
SOLD Oct 8, 2018Dell Precision M6500 17" LED Workstation i7 1.6GHz 4GB RAM 111GB HD DVDRW Win 7
我想得到
"MAX DELL PRECISION M4800 I7-4930XM EXTREME EDITION 3GHz 16GB 500GB SSD K2100 FHD"
如果我能够删除该部分,我想我可以执行 [0].text 路由(因为我正在遍历网页)
<div class="s-item__title-tag">SOLD Oct 9, 2018</div>
我试图查看文档,但很困惑。我的问题有点类似于在另一个 div 中的 div 之后获取内容,但仍然需要澄清。
python 3.5 with BeautifulSoup win 10
相关分类