我有以下 html 代码(或者至少我认为它是 html),我正在 Python 上使用 BeautifulSoup。
我已经正确地使用 Beautiful Soup 解析了 html。接下来我想做的是检索与包含某个数据标签的“div”相关联的内容(例如,在代码的底部,data-label="Relation")。特别是,我想获得一个字典,它以数据标签的文本作为键,即在我的示例“关系”中,并将相同“div”的内容作为值,即在我的示例中,href“ http: //documenti.camera.it/apps/commonServices/getDocumento.ashx?sezione=bollettini=comunicato=17=2016=06=14=03=data.20160614.com03.bollettino.sede00020.tit00010.int0602010. com03.bollettino.sede00020.tit00010.int00010#data.20160614.com03.bollettino.sede00020.tit00010.int00010 "
我尝试了几种方法,但据我所知,数据标签似乎不是一个有效的属性,所以我不确定如何处理这个问题。
(请注意,这只是一个示例,但我必须对这些具有类似结构的数千个甚至数百万个网页执行相同的操作)。
相关分类