我有这样的html
<span class="age">
Ages 15
<span class="loc" id="loc_loads1">
</span>
<script>
getCurrentLocationVal("loc_loads1",29.45218856,59.38139268,1);
</script>
</span>
我正在尝试Age 15使用BeautifulSoup
所以我写了python代码如下
代码:
from bs4 import BeautifulSoup as bs
import urllib3
URL = 'html file'
http = urllib3.PoolManager()
page = http.request('GET', URL)
soup = bs(page.data, 'html.parser')
age = soup.find("span", {"class": "age"})
print(age.text)
输出:
Age 15 getCurrentLocationVal("loc_loads1",29.45218856,59.38139268,1);
我只想要标签Age 15内的功能script。有没有办法只获取 text: Age 15?或者有什么方法可以排除script标签的内容?
PS:script标签太多,URL不同。我不喜欢从输出中替换文本。
幕布斯7119047
临摹微笑
相关分类