手记

PHP通过SimpleXML访问xml文档 (二)

修改内容

利用SimpleXML修改元素内容非常方便,你可以改变或移除树中的某个元素,但是不能直接在树中添加一个元素。要添加一个元素,可以使用DOM的互操作性:

  1. $xml = "<root><node1>content</node1></root>";

  2. $sxe = new SimpleXMLElement($xml);

  3. $dom = dom_import_simplexml($sxe);

  4. $dom->appendChild(new DOMElement("node2", "content2"));

  5. print $sxe->asXML();

输出:

  1. <?xml version="1.0"?>

  2. <root><node1>content</node1><node2>content2</node2></root>

编辑文本内容

可以利用SimpleXML的属性赋值方法来直接编辑一个元素的内容,要主意的是如果文档中有多个元素名一样的元素,如果没有使用索引来指定要编辑哪个元素时PHP将发出一个警告。如:

  1. $book = simplexml_load_file('sxml.xml');

  2. /* Modify an unspecified para element where multiple para elements exist */

  3. $book->chapter->para = "Removed CDATA";

输出:
Warning: main() [/phpmanual/function.main.html]: Cannot assign to an array of nodes
(duplicate subnodes or attr detected)

必须给para指定索引告诉程序你要编辑哪个元素:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->chapter->para[1] = "Removed CDATA";

  3. print $book->chapter->asXML();

输出:

  1. <chapter id="navigation">

  2.     <title>Acessing Elements</title>

  3.     <para>Elements are accessed as properties</para>

  4.     <para>Removed CDATA</para>

  5. </chapter>

这样,第二个para元素的内容被改为Removed CDATA。如果要编辑一个在文档中唯一存在的元素可不必指定索引,直接修改。如修改title:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->chapter->title = "New Title";

  3. $book->chapter->para[1] = "Removed CDATA";

  4. print $book->chapter->asXML();

输出:

  1. <chapter id="navigation">

  2.     <title>New Title</title>

  3.     <para>Elements are accessed as properties</para>

  4.     <para>Removed CDATA</para>

  5. </chapter>

强烈建议使用索引来编辑元素,除非你对文档的结果非常确定。使用索引来编辑title元素会比较安全,如$book->chapter->title[0] = “New Title”;这行代码用索引[0]指定要编辑第一个title。

编辑有子树的元素

  1. $book = simplexml_load_file('sxml.xml');

  2. $cholder = $book->bookinfo->copyright->holder;

  3. print $cholder->asXML()."/n";

  4. $book->bookinfo = "No Book Info";

  5. print $book->bookinfo->asXML()."/n";

  6. print $cholder->asXML()."/n";

输出:

  1. <holder>Rob Richards</holder>

  2. <bookinfo>No Book Info</bookinfo>

  3. Warning: SimpleXMLElement::asXML() [/phpmanual/function.asXML.html]: Node no

  4. longer exists in N:/CVS Projects/php5/Debug_TS/booksxe.php on line 7

这段代码中,首先将文档中的holder元素赋值给$cholder变量,然后打印该变量。bookinfo元素包含有title,author和 copyright子树,它的内容被字符串No Book Info代替,从bookinfo的输出结果可以看出,它的子树被清空并且被字符串代替了。接着试图再次打印$cholder变量的XML内容,程序输出一个警告,这个变量依然是一个SimpleXMLElement对象,但它所属的节点在bookinfo元素改变时已经被破坏了。

另一种情况。将bookinfo元素中的子元素用字符串 代替。

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->bookinfo = "<title>SimpleXML in PHP 5</title>";

  3. print $book->bookinfo->asXML()."/n";

如果你认为上述代码将bookinfo中的内容清空后再给bookinfo创建了一个子节点title,那么你错了。输出结果是
<title>SimpleXML in PHP 5</title>
实际上bookinfo元素的子元素都被移除了,但是新赋值的XML数据被转义成文本内容,而不是一个新的子元素。

如果想用一个子树代替另一个子树,可以利用DOM扩展:

  1. $book = simplexml_load_file('sxml.xml');

  2. $bookinfo = dom_import_simplexml($book->bookinfo);

  3. /* 移除bookinfo元素下的所有子元素*/

  4. while ($bookinfo->firstChild) {

  5. $bookinfo->removeChild($bookinfo->firstChild);

  6. }

  7. $bookinfo->appendChild(new DOMElement("title", "SimpleXML in PHP 5"));

  8. print $book->bookinfo->asXML()."/n";

输出结果:

  1. <bookinfo>

  2. <title>SimpleXML in PHP 5</title>

  3. </bookinfo>

移除元素

可以用PHP内置函数unset()来将一个元素从树中移除。unset()的参数必须是一个SimpleXMLElement,用属性方法来访问要移除的元素。例如,从chapter节点移除title元素:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->chapter->para[1] = "Removed CDATA";

  3. unset($book->chapter->title);

  4. print $book->chapter->asXML();

上述代码执行后,chapter的结构为:

  1. <chapter id="navigation">

  2.  

  3.     <para>Elements are accessed as properties</para>

  4.     <para>Removed CDATA</para>

  5. </chapter>

将这个结果与下面代码执行的结果想比较:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->chapter->para[1] = "Removed CDATA";

  3. $title = $book->chapter->title;

  4. unset($title);

  5. print $book->chapter->asXML();

输出结果

  1. <chapter id="navigation">

  2.     <title>Acessing Elements</title>

  3.     <para>Elements are accessed as properties</para>

  4.     <para>Removed CDATA</para>

  5. </chapter>

title元素没有被移除,unset函数只对$title变量作用并没有将title元素从树中移除。

在移除一个元素时必须注意,用索引来指定的特定元素不会被移除:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->chapter->para[1] = "Removed CDATA";

  3. unset($book->chapter->title[0]);

  4. print $book->chapter->asXML();

输出:

  1. <chapter id="navigation">

  2.     <title>Acessing Elements</title>

  3.     <para>Elements are accessed as properties</para>

  4.     <para>Removed CDATA</para>

  5. </chapter>

如果要移除所有的para元素时可以利用下面代码:

  1. $book = simplexml_load_file('sxml.xml');

  2. unset($book->chapter->para);

  3. print $book->chapter->asXML();

输出:

  1. <chapter id="navigation">

  2.     <title>Acessing Elements</title>

  3.  

  4.  

  5. </chapter>

问题是如果你只想移除其中的一个para元素时要怎么办。这时可以再次用到DOM扩展:

  1. $book = simplexml_load_file('sxml.xml');

  2. $chapter = dom_import_simplexml($book->chapter);

  3. $node = $chapter->lastChild;

  4. while($node) {

  5.     if ($node->nodeName == "para") {

  6.         $chapter->removeChild($node);

  7.         $node = NULL;

  8.         break;

  9.     }

  10.     $node = $node->previousSibling;

  11. }

  12. print $book->chapter->asXML();

输出:

  1. <chapter id="navigation">

  2.     <title>Acessing Elements</title>

  3.     <para>Elements are accessed as properties</para>

  4.  

  5. </chapter>

所幸的是PHP5.2开始已经支持删除用索引指定的元素了:

  1. $book = simplexml_load_file('sxml.xml');

  2. unset($book->chapter->para[1]);

  3. print $book->chapter->asXML();

访问属性

读取属性

下面的代码输出了book元素中的lang属性

  1. $book = simplexml_load_file('sxml.xml');

  2. print $book['lang'];

访问用索引指定的元素的属性:

  1. $book = simplexml_load_file('sxml.xml');

  2. print $book->chapter[0]['id'];

在不知道属性名的情况下可以用attributes()方法来输出属性:

  1. $book = simplexml_load_file('sxml.xml');

  2. foreach($book->chapter->attributes() AS $attribute) {

  3.     print $attribute."/n";

  4. }

如果要获得位置的属性名,可以使用DOM扩展:

  1. $book = simplexml_load_file('sxml.xml');

  2. foreach($book->chapter->attributes() AS $attribute) {

  3.     $att = dom_import_simplexml($attribute);

  4.     print $att->nodeName."/n";

  5.     print $attribute."/n";

  6. }

修改属性
修改属性的值跟修改元素的值一样,直接对其赋值就可以了:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book['lang'] = "es";

  3. print $book['lang'];

添加一个属性也很简单,如果对一个不存在的属性名进行赋值就给元素创建一个新属性

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->bookinfo->author->firstname["prefix"] = "Mr.";

  3. print $book->bookinfo->author->asXML();

输出:

  1. <author>

  2.     <firstname prefix="Mr.">Rob</firstname>

  3.     <surname>Richards</surname>

  4. </author>

移除属性

移除属性也用到unset()函数:

  1. $book = simplexml_load_file('sxml.xml');

  2. $book->bookinfo->author->firstname["prefix"] = "Mr.";

  3. print $book->bookinfo->author->firstname->asXML()."/n/n";

  4. unset($book->bookinfo->author->firstname["prefix"]);

  5. print $book->bookinfo->author->firstname->asXML();

输出:

  1. <firstname prefix="Mr.">Rob</firstname>

  2.  

  3. <firstname>Rob</firstname>

扩展SimpleXMLElement类

  1. class mySXE extends SimpleXMLElement {

  2.     function appendChild($name, $content) {

  3.         $dom = dom_import_simplexml($this);

  4.         $dom->appendChild($dom->ownerDocument->createElement($name, $content));

  5.     }

  6. }

当实例化扩展的类时,文档的每个节点对象的类型都是扩展类的类型。

  1. $sxe = new mySXE("<root><node1></node1></root>");

  2. $sxe->node1->appendChild("node2", "content");

  3. print $sxe->asXML();

输出:

  1. <?xml version="1.0"?>

  2. <root><node1><node2>content</node2></node1></root>

使用new方法可以用来处理字符串类型的XML,如果XML保存在一个文件中,那么可以将扩展的类名作为第二个参数传给simplexml_load_string或simplexml_load_file

  1. $sxe = simplexml_load_string("<root><node1></node1></root>", "mySXE");

  2. $sxe->node1->appendChild("node2", "content");

  3. print $sxe->asXML();

输出结果与用new关键字输出的结果一样。

在SimpleXML中使用命名空间

将清单7-1的内容改为

  1. <?xml version="1.0" encoding="UTF-8"?>

  2. <book lang="en">

  3. <bookinfo xmlns="http://www.example.com/ns1">

  4.     <title>SimpleXML in PHP 5</title>

  5.     <author>

  6.         <firstname>Rob</firstname>

  7.         <surname>Richards</surname>

  8.     </author>

  9.     <copyright>

  10.         <year>2005</year>

  11.         <holder>Rob Richards</holder>

  12.     </copyright>

  13.     </bookinfo>

  14. </book>

如果试图用普通的方法来访问元素或属性,你会分析这并不可行,例如:

  1. $book = simplexml_load_file('sxmlns.xml');

  2. print $book["lang"]."/n";

  3. print $book->bookinfo->title."/n";

输出的结果是两行空白。

在访问命名空间节点前,必须使用children()和attributes()方法。这两个方法不仅可以在没有指定参数的时候使用,也可以在指定一个 URI命名空间作为参数使用。如果一个SimleXMLElement对象是从这两个方法返回的,那么你就可以像普通的元素和属性一样访问命名空间下的元素和属性:

  1. $book = simplexml_load_file('sxmlns.xml');

  2. /* 返回 http://www.example.com/ns2 命名空间下的所有属性 */

  3. $bookatts = $book->attributes("http://www.example.com/ns2");

  4. print $bookatts["lang"]."/n";

  5. /* 返回 http://www.example.com/ns1 命名空间下的所有元素*/

  6. $bookns = $book->children("http://www.example.com/ns1");

  7. $bookinfo = $bookns->bookinfo;

  8. /* 重置命名空间来访问非命名空间的元素 */

  9. $nonsbkinfo = $bookinfo->children();

  10. print $nonsbkinfo->title."/n";

children ()和attributes()方法可以被看做是过滤器,如果没有参数或者传递一个NULL作为参数,这两个方法将返回非命名空间下的元素或属性;否则将返回特定命名空间下的元素或属性。在重置之前,命名空间仍然起作用并且被子节点继承。例如,使用$bookinfo被设置为命名空间http://www.example.com/ns1的对象,可以使用 print $bookinfo->author->firstname来但因author中的firstname元素。所有的元素都在命名空间下,因此你在创建$bookinfo对象时不必一直使用children()设置命名空间。



1人推荐
随时随地看视频
慕课网APP