手记

使用DOM解析器解析XML文件 学习笔记

  1. dom解析和dom4j原理一致

  2. Node是所有元素的父接口

  3. 常用的API:

  • DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();取得DOM解析器工厂

  • DocumentBuilder domParser = factory.newDocumentBuilder();取得DOM解析器

  • domParser.parse(*.xml)加载需要解析的XML文件

  • Document.getDocumentElement()取得XML文件的根元素/节点

  • Element.getNodeName():取得根元素

  • Element.getElementsByTagName("汽车")取得"汽车"元素的集合

  • NodeList.item(i)取得第N个元素,从0开始

  • Element.getTextContent():取得元素的文本内容

  • Element.getAttributes().getNamedItem("出产时间").getTextContent():取得元素中某属性的值

  • document.createElement("汽车");创建新元素

  • Element.setTextContent("我的汽车");设置元素的内容

  • Element.appendChild(newCarElement);在尾部添加元素

  • Element.insertBefore(newCarElement,

  • rootElement.getElementsByTagName("汽车").item(1));在指定的元素前添加元素

  • TransformerFactory tf = TransformerFactory.newInstance();创建输出工厂

  • Transformer transformer = tf.newTransformer();创建输出对象

  • Source source = new DOMSource(document);创建内存的document对象

  • Result result = new StreamResult(new File("src/cn/itcast/xml/dom/car.xml"));指定输出的目标地点

  • transformer.transform(source,result);将document对象输出到xml文件中

  • Element.setTextContent("深圳");更新元素的内容

  • Element.removeChild(secondCarElement);在父元素基础上删除直接子元素

dom解析器会将空白字符当作有效元素对待

要让dom解析器将空白字符忽略,必须满足二条件
a)对XML文件必须写一个DTD约束
b)factory.setIgnoringElementContentWhitespace(true);

dom类解析器和sax类解析器
a)dom是一次性加载到内容,形成document对象,人工导航,适合curd
b)sax是分次性加载到内容,sax解析器导航,但程序员需要编写sax处理器,必须扩展DefaultHandler类,适合r

car.xml

<车辆清单>    <汽车>        <车牌 出产时间="2010年">奥迪</车牌>        <产地>北京</产地>        <单价>30</单价>    </汽车>    <汽车>        <车牌 出产时间="2012年">本田</车牌>        <产地>深圳</产地>        <单价>60</单价>    </汽车></车辆清单>
import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;import org.w3c.dom.Document;import org.w3c.dom.Element;import org.w3c.dom.NodeList;//使用DOM解析器解析XML文件public class Demo1 {    public static void main(String[] args) throws Exception {        DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();        DocumentBuilder domParser = factory.newDocumentBuilder();        Document document = domParser.parse(new File("src/cn/itcast/xml/dom/car.xml"));        Element rootElement  = document.getDocumentElement();        System.out.println("根元素为:"+rootElement.getNodeName());        NodeList nodeList = rootElement.getElementsByTagName("汽车");        System.out.println("共有:" + nodeList.getLength()+"辆汽车");        System.out.println("++++++++++++++++++++++++++");        for(int i=0;i<nodeList.getLength();i++){            Element element = (Element) nodeList.item(i);            String band = element.getElementsByTagName("车牌").item(0).getTextContent();            String place = element.getElementsByTagName("产地").item(0).getTextContent();            String price = element.getElementsByTagName("单价").item(0).getTextContent();            String time = element.getElementsByTagName("车牌").item(0).getAttributes().getNamedItem("出产时间").getTextContent();                 System.out.println("车牌:" + band);            System.out.println("产地:" + place);            System.out.println("单价:" + price);            System.out.println("出产时间:" + time);            System.out.println("-------------------------");        }    }}

结果:
根元素为:车辆清单
共有:2辆汽车
++++++++++++++++++++++++++
车牌:奥迪
产地:北京
单价:30
出产时间:2010年

车牌:本田
产地:深圳
单价:60
出产时间:2012年

0人推荐
随时随地看视频
慕课网APP