我正在循环浏览网页的 HTML 内容并尝试仅打印带有子字符串“状态失败”的字符串。然而,Python 正在打印每一个字符串,即使是那些没有子字符串“状态失败”的字符串。
这是我的代码:
soup = bs(html_page, 'lxml')
outF = open('C:/Users/ryans/OneDrive/Desktop/test.csv', 'w')
for link in soup.findAll('rect'):
if "state failed" in link:
if link.isoweekday() in range(1, 6):
outF.write(str(link))
outF.write('\n')
outF.close()
这是我希望打印的一个,它是。
<rect class="state failed" data-original-title="Task_id: failure_cleanup<br>Run: 2018-12-22T04:00:00<br>Operator: CruxCleanupOperator<br>Started: 2018-12-24T18:34:39.149434<br>Ended: 2018-12-24T18:34:45.935977<br>Duration: 6.78654<br>State: failed<br>" data-toggle="tooltip" height="10" rx="0" ry="0" style="shape-rendering: crispedges; stroke-width: 1; stroke-opacity: 1;" title="" width="10" x="984" y="-5"></rect>
这是我希望不会被打印的一个,但出于某种奇怪的原因正在打印它。
<rect class="state success" data-original-title="Task_id: join_cleanup<br>Run: 2018-12-22T04:00:00<br>Operator: CompletionBranchOperator<br>Started: 2018-12-24T18:33:30.834983<br>Ended: 2018-12-24T18:33:33.037330<br>Duration: 2.20235<br>State: success<br>" data-toggle="tooltip" height="10" rx="0" ry="0" style="shape-rendering: crispedges; stroke-width: 1; stroke-opacity: 1;" title="" width="10" x="984" y="-5"></rect>
我用单引号、双引号甚至三引号将所有组合绑定在一起。没关系。它打印所有内容,甚至是不包含“状态失败”的字符串。知道这里有什么问题吗?谢谢。
隔江千里
慕斯王
相关分类