我已经用 python 编写了一个脚本来从一大块 html 元素中提取地址。地址在几个br标签内。但是,当我运行我的脚本时,我将其[<br/>, <br/>, <br/>, <br/>]作为输出。
我怎样才能得到完整的地址?
我试图从以下位置收集地址的 html 元素:
<div class="ACA_TabRow ACA_FLeft">
Mailing
<br/>
1961 MAIN ST #186
<br/>
WATSONVILLE, CA, 95076
<br/>
United States
<br/>
</div>
到目前为止我已经尝试过:
from bs4 import BeautifulSoup
import re
html = """
<div class="ACA_TabRow ACA_FLeft">
Mailing
<br/>
1961 MAIN ST #186
<br/>
WATSONVILLE, CA, 95076
<br/>
United States
<br/>
</div>
"""
soup = BeautifulSoup(html,"lxml")
items = soup.find(class_="ACA_TabRow").find(string=re.compile("Mailing")).find_next_siblings()
print(items)
相关分类