Java语言编程中更新XML文档的常用方法集

首页

会员注册

文章探索: 分类: 关键字:

+ 栏目导航

ASP教程	C#教程
JSP教程	VB教程
PHP教程	ACCESS教程
XML教程	FLASH教程
SQL教程	ASP.NET教程
java教程	JavaScript教程
SEO网站优化	网站网络营销

+ 相关文章

Ajax核心：XMLHTTP组件相关技术资料

远程获取内容，并将内容存在本地电脑..

xmlhttp组件获取远程文件并筛选出目标..

XMLHTTP对象及其方法

把HTML表单提交的数据转化成XML文件

利用XMLHTTP无刷新添加数据之Post篇

Js+Xml:不刷新页面获取对应网址的网页..

xml(元标记语言)学习基础一

Java语言编程中更新XML文档的常用方法..

简析JAVA中的XML编程

XML及其技术指南

XML教程(2)--XML元素与XML属性值

动态产生XML文档的几种方式

技术教程 -> XML教程 ->

Java语言编程中更新XML文档的常用方法集

来源：转载人气：1700 录入时间：2007-11-8

    　　本文简要的讨论了Java语言编程中更新XML文档的四种常用方法，并且分析这四种方法的优劣。其次，本文还对如何控制Java程序输出的XML文档的格式做了展开论述。
   　　
   　　JAXP是Java API for XML Processing的英文字头缩写，中文含义是:用于XML文档处理的使用Java语言编写的编程接口。JAXP支持DOM、SAX、XSLT等标准。为了增强JAXP使用上的灵活性，开发者特别为JAXP设计了一个Pluggability Layer，在Pluggability Layer的支持之下，JAXP既可以和具体实现DOM API、SAX API 的各种XML解析器(XML Parser，例如Apache Xerces)联合工作，又可以和具体执行XSLT标准的XSLT处理器(XSLT Processor，例如Apache Xalan)联合工作。
   　　
   　　应用Pluggability Layer的好处在于:我们只需要熟悉JAXP各个编程接口的定义即可，而不需要对所采用的具体的XML解析器、XSLT处理器有很深入的了解。比如在某个Java程序中，通过JAXP调用XML解析器Apache Crimson对XML文档进行处理，如果我们希望使用别的XML解析器(比如Apache Xerces)，以便提高该程序的性能，那么原程序代码可能不需要任何改变，直接就可以使用(你所需要做的事情只是将包含Apache Xerces代码的jar文件加入到环境变量CLASSPATH中，而将包含Apache Crimson代码的jar文件在环境变量CLASSPATH中删除)。
   　　
   　　目前JAXP已经应用的十分普遍了，可以说是Java语言中处理XML文档的标准API。有些初学者在学习使用JAXP的过程中，经常会提出这样的问题:我编写的程序对DOM Tree做了更新，但是当程序退出以后，原始的XML文档并没有改变，还是老样子，如何实现对原始XML文档和DOM Tree的同步更新呢？咋一看来，在JAXP中似乎没有提供相应的接口/方法/类，这是很多初学者都感到困惑的问题。本文的主旨就在于解决这个问题，简单的介绍几种常用的同步更新原始XML文档和DOM Tree的方法。为了缩小讨论的范围，本文所涉及的XML解析器仅包括Apache Crimson和Apache Xerces，而XSLT处理器仅仅使用Apache Xalan。
   　　
   　　方法一:直接读写XML文档
   　　
   　　这也许是最笨最原始的办法了。当程序获取DOM Tree之后，应用DOM模型的Node接口的各个方法对DOM Tree进行更新，下一步应该对原始的XML文档进行更新了。我们可以运用递归的办法或者是应用TreeWalker类，遍历整个DOM Tree，与此同时，将DOM Tree的每一个节点/元素依次写入到预先打开的原始XML文档中，当DOM Tree被遍历完全之后，DOM Tree和原始的XML文档就实现了同步更新。实际中，这个方法极少使用，不过如果你要编程实现自己的XML解析器，这种方法还是有可能用得上的。
   　　
   　　方法二:使用XmlDocument类
   　　
   　　使用XmlDocument类？JAXP中分明没有这个类呀!是不是作者搞错了？没有错!就是使用XmlDocument类，确切的说，是使用XmlDocument类的write()方法。
   　　
   　　在上文已经提到过，JAXP可以和各种各样的XML解析器联合使用，这次我们选用的XML解析器是Apache Crimson。XmlDocument(org.apache.crimson.tree.XmlDocument)是Apache Crimson的一个类，并不包含于标准的JAXP中，难怪在JAXP的文档中找不到XmlDocument类的芳踪呢。现在问题出来了，如何应用XmlDocument类来实现更新XML文档的功能？在XmlDocument类中提供了下面三个write()方法(根据Crimson最新的版本------Apache Crimson 1.1.3):
   　　
   　　public void write (OutputStream out) throws IOException
   　　public void write (Writer out) throws IOException
   　　public void write (Writer out， String encoding) throws IOException
   　　
   　　上述三个write()方法的主要作用就是输出DOM Tree中的内容到特定的输出介质中，比如文件输出流、应用程序控制台等等。那么又如何使用上述三个write()方法呢？请看下面的Java程序代码片断:
   　　
   　　String name="fancy";
   　　DocumentBuilder parser;
   　　DocumentBuilderFactory factory =
   　　DocumentBuilderFactory.newInstance();
   　　try
   　　{
   　　parser = factory.newDocumentBuilder();
   　　Document doc = parser.parse("user.xml");
   　　Element newlink=doc.createElement(name);
   　　doc.getDocumentElement().appendChild(newlink);
   　　((XmlDocument)doc).write(new FileOutputStream
   　　(new File("xuser1.xml")));
   　　}
   　　catch (Exception e)
   　　{
   　　//to log it
   　　}
   　　
   　　在上面的代码中，首先创建了一个Document对象doc，获取完整的DOM Tree，然后应用Node接口的appendChild()方法，在DOM Tree的最后追加了一个新节点(fancy)，最后调用XmlDocument类的write(OutputStream out)方法，把DOM Tree中的内容输出到xuser.xml中(其实也可以输出到user.xml，更新原始的XML文档，在这里为了便于做对比，故而输出到xuser.xml文件中)。需要注意的是不能直接对Document对象doc直接调用write()方法，因为JAXP的Document接口并没有定义任何write()方法，所以必须将doc由Document对象强制转换为XmlDocument对象，然后才能调用write()方法，在上面的代码中使用的是write(OutputStream out)方法，这个方法使用缺省的UTF-8编码输出DOM Tree中的内容到特定的输出介质中，如果DOM Tree中包含中文字符，那么输出的结果有可能是乱码，亦即存在所谓的"汉字问题"，解决的办法是使用write (Writer out， String encoding)方法，显式指定输出时的编码，例如将第二个参数设为"GB2312"，这时即不存在"汉字问题"，输出结果能够正常显示中文字符。
   　　
   　　该例子的运行环境为:Windows XP Professional、JDK 1.3.1。为了能够正常编译运行AddRecord.java这个程序，你需要到网址http://xml.apache.org/dist/crimson/去下载Apache Crimson，并将所获取的crimson.jar文件加入到环境变量CLASSPATH中。
   　　
   　　注意:
   　　
   　　Apache Crimson的前身是Sun Project X Parser，后来不知何故，由X Parser演变为Apache Crimson，至今Apache Crimson的很多代码都是从X Parser中直接移植过来的。比如上文用到的XmlDocument类，它在X Parser中是com.sun.xml.XmlDocument，到了Apache Crimson中摇身一变，就变成了org.apache.crimson.tree.XmlDocument类，其实它们的绝大部分代码是一样的，可能就package语句和import语句以及文件开头的一段lience有所不同而已。早期的JAXP是和X Parser捆绑在一起的，因此一些老的程序使用了com.sun.xml包，如果你现在重新编译它们，有可能不能通过，肯定就是因为这个原因。
   　　
   　　后来的JAXP和Apache Crimson捆绑在一起，比如JAXP 1.1，如果你使用JAXP 1.1，那么不需要额外下载Apache Crimson，也能够正常编译运行上面的例子(AddRecord.java)。最新的JAXP 1.2 EA(Early Access)改弦更张，采用性能更好的Apache Xalan和Apache Xerces分别作为XSLT处理器和XML解析器，不能直接支持Apache Crimson了，所以如果你的开发环境采用了JAXP 1.2 EA或者是Java XML Pack(内含JAXP 1.2 EA)，那么将无法直接编译运行上面的例子(AddRecord.java)，你需要额外下载并安装Apache Crimson。
   　　
   　　方法三:使用TransformerFactory和Transformer类
   　　
   　　在JAXP中所提供的标准的更新原始XML文档的方法就是调用XSLT引擎，亦即使用TransformerFactory和Transformer类。请看下面的Java代码片断:
   　　
   　　//首先创建一个DOMSource对象，
   　　该构造函数的参数可以是一个Document对象
   　　//doc代表更改后的DOM Tree。
   　　DOMSource doms = new DOMSource (doc);
   　　//创建一个File对象，
   　　代表DOM Tree所包含的数据的输出介质，
   　　这是一个XML文件。
   　　File f = new File ("XMLOutput.xml");
   　　//创建一个StreamResult对象，该构造函数的参数可以取为File对象。
   　　StreamResult sr = new StreamResult (f);
   　　
   　　//下面调用JAXP中的XSLT引擎来实现
   　　输出DOM Tree中的数据到XML文件中的功能。
   　　//XSLT引擎的输入为DOMSource对象，输出为StreamResut对象。
   　　try
   　　{
   　　//首先创建一个TransformerFactory对象，
   　　再由此创建Transformer对象。Transformer
   　　//类相当于一个XSLT引擎。
   　　通常我们使用它来处理XSL文件，但是在这里我们使
   　　//用它来输出XML文档。
   　　TransformerFactory tf=TransformerFactory.newInstance();
   　　Transformer t=tf.newTransformer ();
   　　
   　　//关键的一步，调用Transformer对象
   　　(XSLT引擎)的transform()方法，
   　　该方法的第一
   　　//个参数是DOMSource对象，第二个参数是StreamResult对象。
   　　t.transform(doms，sr);
   　　}
   　　catch (TransformerConfigurationException tce)
   　　{
   　　System.out.println("Transformer
   　　Configuration Exception\n-----");
   　　tce.printStackTrace();
   　　}
   　　catch (TransformerException te)
   　　{
   　　System.out.println ("Transformer
   　　Exception\n---------");
   　　te.printStackTrace ();
   　　}
   　　
   　　在实际的应用中，我们可以应用传统的DOM API从XML文档中获取DOM Tree，然后根据实际的需求对DOM Tree执行各种操作，得到最终的Document对象，接下来可以由此Document对象创建DOMSource对象，剩下的事情就是照搬上面的代码了，程序运行完毕后，XMLOutput.xml就是你所需要的结果(当然了，你可以随意更改StreamResult类构造函数的参数，指定不同的输出介质，而不必是千篇一律的XML文档)。
   　　
   　　这个方法最大的好处在于可以随心所欲的控制DOM Tree中的内容输出到输出介质中的格式，但是光靠TransformerFactor

[关闭窗口]

公司地址: 广州市荔湾区东漖北路560号511室

电话:020-81803473 传真:020-81544987