在Java中實現DOM文檔和XML文件互相轉換

文簡要描述了DOM的概念和內部邏輯結構,實例講述DOM文檔操作和XML文件互相轉換的java實現過程。

1. DOM簡介

目前,W3C已于2000年11月13日推出了規範DOM level 2。文檔對象模型(DOM)是HTML和XML文檔的編程接口規範,它與平台和語言是無關的,因而可以用各種語言在各種平台上實現。該模型定義了THML和XML文件在內存中的邏輯結構(即爲文檔),提供了訪問、存取THML和XML文件的方法。利用DOM規範,可以實現DOM 文檔和XML之間的相互轉換,遍曆、操作相應DOM文檔的內容。可以說,要自由的操縱XML文件,就要用到DOM規範。

2. DOM內部邏輯結構

DOM文檔中的邏輯結構可以用節點樹的形式進行表述。通過對XML文件的解析處理,XML文件中的元素便轉化爲DOM文檔中的節點對象。DOM的文檔節點有Document、Element、Comment、Type等等節點類型,其中每一個DOM文檔必須有一個Document節點,並且爲節點樹的根節點。它可以有子節點,或者葉子節點如Text節點、Comment節點等。任何的格式良好的XML文件中的每一個元素均有DOM文檔中的一個節點類型與之對應。利用DOM接口將XML文件轉化成DOM文檔後,我們就可以自由的處理XML文件了。

3. java中的DOM接口

DOM規範提供的API的規範,目前Sun公司推出的jdk1.4測試版中的java API遵循了 DOM level 2 Core推薦接口的語義說明,提供了相應的java語言的實現。

在org.xml.dom中,jkd1.4提供了Document、DocumentType、Node、NodeList、Element、Text等接口,這些接口均是訪問DOM文檔所必須的。我們可以利用這些接口創建、遍曆、修改DOM文檔。

在javax.xml.parsers中,jkd1.4提供的DoumentBuilder和DocumentBuilderFactory組合可以對XML文件進行解析,轉換成DOM文檔。

在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了DOMSource類和StreamSource類,可以用來將更新後的DOM文檔寫入生成的XML文件中。

4. 例程

4.1 將XML文件轉化成DOM文檔

這個過程是獲得一個XML文件解析器,解析XML文件轉化成DOM文檔的過程。

Jdk1.4中,Document接口描述了對應于整個XML文件的文檔樹,提供了對文檔數據的訪問,是該步驟的目標。Document接口可以從類DocumentBuilder中獲取,該類包含了從XML文檔獲得DOM文檔實例的API。XML的解析器可以從類DocumentBuilderFactory中獲取。在jdk1.4中,XML文件轉化成DOM文檔可以有如下代碼實現:

//獲得一個XML文件的解析器

DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

//解析XML文件生成DOM文檔的接口類,以便訪問DOM。

DocumentBuilder builder = factory.newDocumentBuilder();

document = builder.parse( new File(FileName) );

4.2 遍曆DOM文檔

獲得接口類document實例後,可以對DOM的文檔樹進行訪問。要遍曆DOM文檔,首先要獲得Root元素。然後獲得Root元素的子節點列表。這裏通過遞歸的方法實現遍曆的目的。

//獲得Root元素

Element element = document.getDocumentElement();

//獲得Root元素的子節點列表

nodelist = element.getChildNodes();

//用遞歸方法實現DOM文檔的遍曆

GetElement(nodelist);

其中GetElement方法實現如下:

public void GetElement(NodeList nodelist){

Node cnode;

int i,len;

String str;

if(nodelist.getLength() == 0)

// 該節點沒有子節點

return;

}

for(i=0;i 1)

System.out.println(" "+str+" "+len);

}

}

}

注意:上面的代碼只是顯示Node類型和Text類型的對象。它們的類型標識分別是1和3。

4.3 修改DOM文檔

修改DOM文檔的API在DOM level 2 Core規範中做了說明,jkd1.4中的org.xml.dom中實現了這些API。修改DOM文檔操作主要集中在Document、Element、Node、Text等類中,這裏給出的例子中是在解析出的DOM文檔中增加一系列對象,對應與在XML文件中增加一條記錄。

// 獲得Root對象

Element root = document.getDocumentElement();

// 在DOM文檔中增加一個Element節點

Element booktype = document.createElement("COMPUTES");

//將該節點轉化成root對象的子節點

root.appendChild(cdrom);

//在DOM文檔中增加一個Element節點

Element booktitle = document.createElement("Title");

//將該節點轉化成booktype對象的子節點

booktype.appendChild(booktitle);

//在DOM文檔中增加一個Text節點

Text bookname = document.createTextNode("understand Corba");

//將該節點轉化成bookname對象的子節點

booktitle.appendChild(bookname);

4.4 將DOM文檔轉化成XML文件

// 獲得將DOM文檔轉化爲XML文件的轉換器,在jdk1.4中,有類TransformerFactory

// 來實現,類Transformer實現轉化API。

TransformerFactory tfactory = TransformerFactory.newInstance();

Transformer transformer = tfactory.newTransformer();

// 將DOM對象轉化爲DOMSource類對象,該對象表現爲轉化成別的表達形式的信息容器。

DOMSource source = new DOMSource(document);

/* 獲得一個StreamResult類對象,該對象是DOM文檔轉化成的其他形式的文檔的容器,

可以是XML文件,文本文件,HTML文件。這裏爲一個XML文件。*/

StreamResult result = new StreamResult(new File(“text.xml”));

// 調用API,將DOM文檔轉化成XML文件。

transformer.transform(source,result);

這裏提供了該例程的完整程序,該例程在windows 2000中jdk1.4環境中運行通過。

以上給出了一個例子,讀者可以從中了解到對DOM操作的思路。因爲對DOM的操作均遵循了DOM規範,所以也適用于其它語言對DOM的處理。

DOM文檔操作和XML文件互相轉換的java實現
  簡介:該文簡要描述了DOM的概念和內部邏輯結構,給出了DOM文檔操作和XML文件互相轉換的Java實現過程。1. DOM簡介目前,W3C已于2000年11月13日推出了規範DOM level 2。文檔對象模型(DOM)是Html和XML文檔的編程接...查看完整版>>DOM文檔操作和XML文件互相轉換的java實現
 
Java實現用DOM文檔和XML文件互換的操作
該文簡要描述了DOM的概念和內部邏輯結構,給出了DOM文檔操作和XML文件互相轉換的Java實現過程。 1. DOM簡介 目前,W3C已于2000年11月13日推出了規範DOM level 2。文檔對象模型(DOM)是Html和XML文檔的編程接口規範,...查看完整版>>Java實現用DOM文檔和XML文件互換的操作
 
DOM文檔操作和XML文件互換java實現
  簡介:該文簡要描述了DOM的概念和內部邏輯結構,給出了DOM文檔操作和XML文件互相轉換的Java實現過程。1. DOM簡介目前,W3C已于2000年11月13日推出了規範DOM level 2。文檔對象模型(DOM)是Html和XML文檔的編程接...查看完整版>>DOM文檔操作和XML文件互換java實現
 
Java解析XML文檔——dom解析xml
  一、前言  用Java解析XML文檔,最常用的有兩種方法:使用基于事件的XML簡單API(Simple API for XML)稱爲SAX和基于樹和節點的文檔對象模型(Document Object Module)稱爲DOM。Sun公司提供了Java API for XML...查看完整版>>Java解析XML文檔——dom解析xml
 
Java解析XML文檔——dom解析xml
  一、前言    用Java解析XML文檔,最常用的有兩種方法:使用基于事件的XML簡單API(Simple API for XML)稱爲SAX和基于樹和節點的文檔對象模型(Document Object Module)稱爲DOM。Sun公司提供了Java API for...查看完整版>>Java解析XML文檔——dom解析xml
 
Java程序把Word文檔直接轉換成HTML文件
  Jacob是Java和Windows下的Com橋,通過它我們可以在Java程序中調用COM組件。假如你的JDK是1.4,那你需要下載Jacob1.9的jni庫才能正常運行,早期版本在JDK1.4下有些問題。 package com; /*** 〈p〉Title:Word文檔轉...查看完整版>>Java程序把Word文檔直接轉換成HTML文件
 
JAVA的XML編程(dom)
XML作爲全球通用的結構化語言,越來越受人們青睐,各種開發平台(比如Microsoft Studio系列、Oracle系列、Inprise Borland系列等)也都把支持XML開發作爲宣傳口號之一 。由于筆者所從事的電子政務開發較早的引入了XM...查看完整版>>JAVA的XML編程(dom)
 
Java與XML聯合編程之DOM篇(1)
DOM初步 DOM是Document Object Model的縮寫,即文檔對象模型。前面說過,XML將數據組織爲一顆樹,所以DOM就是對這顆樹的一個對象描敘。通俗的說,就是通過解析XML文檔,爲XML文檔在邏輯上建立一個樹模型,樹的節點是...查看完整版>>Java與XML聯合編程之DOM篇(1)
 
Java與XML聯合編程之DOM篇
Java與XML聯合編程之DOM篇
  DOM初步   DOM是Document Object Model的縮寫,即文檔對象模型。前面說過,xml將數據組織爲一顆樹,所以DOM就是對這顆樹的一個對象描敘。通俗的說,就是通過解析XML文檔,爲XML文檔在邏輯上建立一個樹模型,樹...查看完整版>>Java與XML聯合編程之DOM篇
 
 
回到王朝網路移動版首頁