猿问

无法从某些 html 元素中提取某些地址

我已经用 python 编写了一个脚本来从一大块 html 元素中提取地址。地址在几个br标签内。但是,当我运行我的脚本时,我将其[<br/>, <br/>, <br/>, <br/>]作为输出。


我怎样才能得到完整的地址?


我试图从以下位置收集地址的 html 元素:


<div class="ACA_TabRow ACA_FLeft">

 Mailing

 <br/>

 1961 MAIN ST #186

 <br/>

 WATSONVILLE, CA, 95076

 <br/>

 United States

 <br/>

</div>

到目前为止我已经尝试过:


from bs4 import BeautifulSoup

import re


html = """

<div class="ACA_TabRow ACA_FLeft">

 Mailing

 <br/>

 1961 MAIN ST #186

 <br/>

 WATSONVILLE, CA, 95076

 <br/>

 United States

 <br/>

</div>

"""

soup = BeautifulSoup(html,"lxml")

items = soup.find(class_="ACA_TabRow").find(string=re.compile("Mailing")).find_next_siblings()

print(items)


小唯快跑啊
浏览 152回答 3
3回答
随时随地看视频慕课网APP

相关分类

Python
我要回答