RSS源XML
对于RSS源的XML文件,开头如下:
<?xml version="1.0"?><rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
对于这类xml的解析代码如下:
from xml.etree.ElementTree import parse# 解析XML文件doc = parse('d:\\rss20.xml')# 获取对应的节点for item in doc.iterfind('channel/item'):# 获取属性对应的值 title = item.findtext('title') print(title) print()
常规XML
对于常规的XML文件,开头如下:
<?xml version="1.0" encoding="utf-8"?>
对于这类XML文件的解析代码如下:
from xml.etree.ElementTree import parse# 解析XMLdoc = parse('d:\\356.xml')# 获取根节点root = doc.getroot()# 获取根节点下面的下一节点for data in root.findall('data'): for report in data.findall('report'): for targets in report.findall('targets'): for target in targets.findall('target'): print('扫描ip:', end='')# 获取属性对应的值 ip = target.find('ip').text print(ip)