发送 python HTTP 请求后,它的响应(数据)有一个 html 页面,其中包含许多 ABCD 块。这是一个片段
<tr>
<td class="success"></td>
<td class="truncate">ABCD</td>
<td>12/18/2018 21:45</td>
<td>12/18/2018 21:46</td>
<td>10</td>
<td>10</td>
<td>100.0</td>
<td><span class="label success">Success</span></td>
<td>SMS</td>
<td>
<a data-id="134717" class="btn" title="Go">View</a>
</td>
</tr>
我需要检索 ABCD 的最新数据 ID(在本例中为 134717,这个数字是动态的)。另请注意,有许多具有不同日期的 ABCD,我想要最新的 .
我可以使用正则表达式并逐行完成。但我认为最好用 BeautifulSoup 来做。
我试过这个它可以找到所有的 ABCD,但我不知道如何获得最新的:
soup = BeautifulSoup(data, "html.parser")
for i in soup.select("td.truncate"):
#print(i.text)
if i.text == "ABCD":
print ("Got it ", i.text)
id1 = soup.select_one("a.data-id")
print (id1)
parsed_url1 = urlparse(id1)
哈士奇WWW
相关分类