无法从某些 html 元素中提取某些地址

无法从某些 html 元素中提取某些地址

我已经用 python 编写了一个脚本来从一大块 html 元素中提取地址。地址在几个br标签内。但是，当我运行我的脚本时，我将其[<br/>, <br/>, <br/>, <br/>]作为输出。

我怎样才能得到完整的地址？

我试图从以下位置收集地址的 html 元素：

<div class="ACA_TabRow ACA_FLeft">

Mailing

<br/>

1961 MAIN ST #186

<br/>

WATSONVILLE, CA, 95076

<br/>

United States

<br/>

</div>

到目前为止我已经尝试过：

from bs4 import BeautifulSoup

import re

html = """

<div class="ACA_TabRow ACA_FLeft">

Mailing

<br/>

1961 MAIN ST #186

<br/>

WATSONVILLE, CA, 95076

<br/>

United States

<br/>

</div>

"""

soup = BeautifulSoup(html,"lxml")

items = soup.find(class_="ACA_TabRow").find(string=re.compile("Mailing")).find_next_siblings()

print(items)

小唯快跑啊

浏览 214回答 3

3回答

随时随地看视频慕课网APP

相关分类

Python