使用 selenium 从网站获取跨度文本

我试图抓取的网站如下所示:


<div align="center" class="movietable">

    <span style="width:45px;height:47px;vertical-align:middle;display:table-cell;">

        <a href="browse.php?cat=19"><img border="0" src="styles/images/cat/hd.png" alt="HdO"></a>

    </span>

</div>

<div align="left" class="movietable">

    <span style="padding:0px 5px;width:455px;height:47px;vertical-align:middle;display:table-cell;">

        <a data-toggle="tooltip" data-placement="bottom" data-html="true" title="" href="details.php?id=578197" data-original-title="<img src='https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg'>">

            <b>GET THIS TEXT</b></a><br><font class="small">[Action, Horror, Sci-Fi]</font>

        </span>

    </div>

我怎样才能提取:


<b>标签中的文本- 在这种情况下GET THIS TEXT

font_class = 'small' 的内容 - 在这种情况下,这将是Action, Horror, Sci-Fi

.movietable b 效果很好!!


img_scr 链接 - 在这种情况下它将是 https://trasd.tmdb.org//tqistSlQGQVlvDZHweD.jpg


我不知道如何做到这一点


qq_花开花谢_0
浏览 127回答 3
3回答

慕婉清6462132

以下是您可以使用的CSS选择器:driver.find_element_by_css_selector('div[align=left] b')driver.find_element_by_css_selector('div[align=left] .small')driver.find_element_by_css_selector('a[title]').get_attribute('data-original-title')

有只小跳蛙

您可以使用 xpath 访问所有这些:1) [parents before this div]/div[2]/span/a/b&nbsp;2) [parents before this div]/div[2]/span/font3) [parents before this div]/div[1]/span/a/img[parents before this div] should be /html/body/...
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python