Java 讀取 xml 文件的五種方式

在編寫與 XML 數據交互的現代軟件應用時，有效地讀取和解析 XML 文件是至關重要的。XML（可擴展標記語言）因其靈活性和自我描述性，已成為數據存儲和傳輸的一種普遍格式。對于 Java 開發者來說，Java 提供了多種工具和庫來處理 XML 文件，每種工具都有其獨特的特點和最適用的場景。

本文旨在探討 Java 中處理 XML 文件的五種主要方法：DOM、SAX、StAX、JAXB 和 JDOM。這些技術各有優勢和局限，選擇合適的方法可以大大提高開發效率和程序性能。我們將詳細介紹每種方法的工作原理、典型用途以及如何在 Java 程序中實現它們。

文章目錄

- - 1、Java 讀取 xml 文件的五種方式
  - 2、DOM（文檔對象模型）解析
  - 3、SAX（簡單 API for XML）解析
  - 4、StAX（流 API for XML）解析
  - 5、JAXB（Java Architecture for XML Binding）
  - 6、JDOM（Java Document Object Model）

1、Java 讀取 xml 文件的五種方式

在 Java 中讀取 XML 文件有多種方法，這里列出五種常見的方式：

DOM 解析器（Document Object Model）：DOM 是處理 XML 文件的一種標準方法，它將整個 XML 文件加載到內存中，然后構造成一個樹狀結構以便程序可以操作。這種方法適合于需要對文檔進行頻繁讀寫操作的情況；
SAX 解析器（Simple API for XML）：SAX 是一種基于事件的解析方式，它不會將整個 XML 文檔加載到內存中。這種方法適用于只需要讀取 XML 文檔的情況，特別是處理非常大的文件時；
StAX 解析器（Streaming API for XML）：StAX 是一種拉式解析（Pull Parsing）技術，允許程序員按需讀取 XML 數據。這種方式適合于需要對 XML 文檔進行增量處理的情況；
JAXB（Java Architecture for XML Binding）：JAXB 允許 Java 開發者通過注解將 Java 對象映射到 XML 文件，反之亦然。這適用于需要將 XML 數據直接轉換為 Java 對象的場合；
JDOM（Java Document Object Model）：JDOM 提供了一種簡潔而易用的 API，用于解析、創建和操作 XML 文檔。它基于樹形結構，類似于 DOM，但提供了更簡單的 API，適用于中小型 XML 文件的處理。

首先是 XML 示例：

xml
復制代碼
<?xml version="1.0" encoding="UTF-8"?>
<library><book><title>Java Programming</title><author>John Smith</author><year>2022</year></book><book><title>Python Basics</title><author>Jane Doe</author><year>2021</year></book>
</library>

接下來，我們將使用不同的方式讀取并打印這個 XML 示例。

2、DOM（文檔對象模型）解析

DOM 將整個 XML 文檔加載到內存中，以樹形結構表示。這種方式易于遍歷和操作，適合對整個文檔進行多次讀寫操作，但可能消耗大量內存，不適合處理大型 XML 文件。

DOM 是 Java 標準庫的一部分，無需額外引入依賴。

代碼實現：

package com.lizhengi;import org.w3c.dom.*;
import javax.xml.parsers.*;/*** DOM 方式讀取 XML文件* @author lizhengi*/
public class DomReadExample {public static void main(String[] args) throws Exception {// 創建一個 DocumentBuilderFactory 實例，用于創建 DocumentBuilderDocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();// 使用工廠創建一個 DocumentBuilder 實例，用于解析 XML 文檔DocumentBuilder builder = factory.newDocumentBuilder();// 使用 ClassLoader 獲取資源文件的輸入流，并解析成 Document 對象Document document = builder.parse(DomReadExample.class.getClassLoader().getResourceAsStream("example.xml"));// 獲取 XML 文檔中所有名為 "book" 的元素節點NodeList bookNodes = document.getElementsByTagName("book");// 遍歷每個 "book" 元素節點，并輸出其子元素的內容for (int i = 0; i < bookNodes.getLength(); i++) {Node bookNode = bookNodes.item(i);Element bookElement = (Element) bookNode;// 獲取 "title"、"author" 和 "year" 子元素的內容String title = bookElement.getElementsByTagName("title").item(0).getTextContent();String author = bookElement.getElementsByTagName("author").item(0).getTextContent();String year = bookElement.getElementsByTagName("year").item(0).getTextContent();// 打印輸出圖書的信息System.out.println("Title: " + title + ", Author: " + author + ", Year: " + year);}}
}

3、SAX（簡單 API for XML）解析

SAX 以事件驅動的方式逐行解析 XML 文檔，并在解析過程中觸發事件。它不需要將整個文檔加載到內存中，因此適用于處理大型 XML 文件，但相對于 DOM，它的操作稍顯復雜。

SAX 是 Java 標準庫的一部分，無需額外引入依賴。

代碼實現：

package com.lizhengi;import org.xml.sax.*;
import org.xml.sax.helpers.*;/*** SAX 解析 XML 示例* 該類繼承了 DefaultHandler 類，用于處理 SAX 事件** @author liziheng*/
public class SaxReadExample extends DefaultHandler {// 表示是否在書籍元素內部private boolean inBookElement = false;// 用于存儲當前正在處理的元素的名稱private String currentElement;// 當前書籍的標題private String currentTitle;// 當前書籍的作者private String currentAuthor;// 當前書籍的年份private String currentYear;/*** 開始解析元素時調用** @param uri         元素的命名空間 URI* @param localName   元素的本地名稱* @param qName       元素的限定名稱* @param attributes  元素的屬性*/@Overridepublic void startElement(String uri, String localName, String qName, Attributes attributes) {if ("book".equals(qName)) {// 進入書籍元素內部inBookElement = true;}// 存儲當前元素的名稱currentElement = qName;}/*** 處理元素字符數據時調用** @param ch     字符數組* @param start  字符數據的起始索引* @param length 字符數據的長度*/@Overridepublic void characters(char[] ch, int start, int length) {if (inBookElement) {String content = new String(ch, start, length).trim();if (!content.isEmpty()) {if ("title".equals(currentElement)) {// 設置當前書籍的標題currentTitle = content;} else if ("author".equals(currentElement)) {// 設置當前書籍的作者currentAuthor = content;} else if ("year".equals(currentElement)) {// 設置當前書籍的年份currentYear = content;}}}}/*** 結束解析元素時調用** @param uri       元素的命名空間 URI* @param localName 元素的本地名稱* @param qName     元素的限定名稱*/@Overridepublic void endElement(String uri, String localName, String qName) {if ("book".equals(qName)) {// 打印當前書籍的信息System.out.println("Title: " + currentTitle + ", Author: " + currentAuthor + ", Year: " + currentYear);// 重置當前書籍的信息currentTitle = null;currentAuthor = null;currentYear = null;// 退出書籍元素內部inBookElement = false;}}/*** 主方法，程序入口** @param args 命令行參數* @throws Exception 拋出異常*/public static void main(String[] args) throws Exception {// 創建 XML 解析器XMLReader reader = XMLReaderFactory.createXMLReader();// 設置內容處理器為當前類的實例reader.setContentHandler(new SaxReadExample());// 解析 XML 文件并觸發 SAX 事件reader.parse(new InputSource(SaxReadExample.class.getClassLoader().getResourceAsStream("example.xml")));}
}

4、StAX（流 API for XML）解析

StAX 提供了類似于 SAX 的事件驅動的解析方式，但與 SAX 不同，它提供了更簡潔的 API，并允許開發者在解析過程中靈活地控制流。這使得 StAX 更容易使用和理解。

引入依賴：

        <dependency><groupId>javax.xml.stream</groupId><artifactId>stax-api</artifactId><version>1.0-2</version></dependency>

代碼實現：

package com.lizhengi;import javax.xml.stream.*;/*** 使用 StAX（Streaming API for XML）方式讀取 XML 文件示例* 該類實現了對 XML 文件的解析，并打印每本書的信息** @author lizhengi*/
public class StaxReadExample {public static void main(String[] args) throws Exception {// 創建 XMLInputFactory 實例，用于創建 XMLStreamReaderXMLInputFactory factory = XMLInputFactory.newInstance();// 創建 XMLStreamReader 實例，用于逐行讀取 XML 文件內容XMLStreamReader reader = factory.createXMLStreamReader(StaxReadExample.class.getClassLoader().getResourceAsStream("example.xml"));// 用于存儲當前正在處理的元素的名稱和內容String currentElement = null;String currentTitle = null;String currentAuthor = null;String currentYear = null;// 循環讀取 XML 文件中的內容while (reader.hasNext()) {int event = reader.next();switch (event) {case XMLStreamConstants.START_ELEMENT:// 開始處理元素時，記錄當前元素的名稱currentElement = reader.getLocalName();break;case XMLStreamConstants.CHARACTERS:// 處理元素的字符數據時，獲取字符數據的內容String content = reader.getText().trim();if (!content.isEmpty()) {// 根據當前元素的名稱，存儲相應的內容if ("title".equals(currentElement)) {currentTitle = content;} else if ("author".equals(currentElement)) {currentAuthor = content;} else if ("year".equals(currentElement)) {currentYear = content;}}break;case XMLStreamConstants.END_ELEMENT:// 結束處理元素時，檢查是否為書籍元素的結束標簽if ("book".equals(reader.getLocalName())) {// 打印當前書籍的信息System.out.println("Title: " + currentTitle + ", Author: " + currentAuthor + ", Year: " + currentYear);// 重置當前書籍的信息，準備處理下一本書currentTitle = null;currentAuthor = null;currentYear = null;}break;}}}
}

5、JAXB（Java Architecture for XML Binding）

JAXB 允許將 XML 數據綁定到 Java 對象，從而簡化了 XML 數據與 Java 對象之間的轉換過程。它通常用于處理 XML 數據的映射和序列化，而不是直接解析整個 XML 文檔。

JAXB 也是 Java 標準庫的一部分，無需額外引入依賴。

代碼實現：

package com.lizhengi;import javax.xml.bind.*;
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.ArrayList;
import java.util.List;/*** XML 文件對應的 Java 類，根元素為 "library"*/
@XmlRootElement(name = "library")
class Library {// 用于存儲書籍信息的列表，每個元素對應一個書籍@XmlElement(name = "book")public List<Book> books = new ArrayList<Book>();
}/*** 書籍信息的 Java 類*/
class Book {// 書籍標題@XmlElementpublic String title;// 書籍作者@XmlElementpublic String author;// 出版年份@XmlElementpublic int year;
}/*** 使用 JAXB 方式讀取 XML 文件* @author lizhengi*/
public class JaxbReadExample {public static void main(String[] args) throws Exception {// 創建 JAXBContext 實例，用于創建 UnmarshallerJAXBContext context = JAXBContext.newInstance(Library.class);// 創建 Unmarshaller 實例，用于將 XML 數據轉換為 Java 對象Unmarshaller unmarshaller = context.createUnmarshaller();// 使用 Unmarshaller 解析 XML 文件，并將其轉換為 Library 對象Library library = (Library) unmarshaller.unmarshal(JaxbReadExample.class.getClassLoader().getResourceAsStream("example.xml"));// 遍歷 Library 中的每本書，并打印其信息for (Book book : library.books) {System.out.println("Title: " + book.title + ", Author: " + book.author + ", Year: " + book.year);}}
}

6、JDOM（Java Document Object Model）

JDOM 提供了一種簡潔而易用的 API，用于解析、創建和操作 XML 文檔。它基于樹形結構，類似于 DOM，但提供了更簡單的 API，適用于中小型 XML 文件的處理。

引入依賴：

        <dependency><groupId>org.jdom</groupId><artifactId>jdom2</artifactId><version>2.0.6.1</version></dependency>

代碼實現：

package com.lizhengi;import org.jdom2.*;
import org.jdom2.input.*;/*** 使用 JDOM 方式讀取 XML 文件* 該程序從 XML 文件中讀取圖書信息，并打印每本書的標題、作者和年份* XML 文件的根元素為 "library"，每個 "book" 元素表示一本書* @author lizhengi*/
public class JdomReadExample {public static void main(String[] args) throws Exception {// 使用 SAXBuilder 創建解析器SAXBuilder builder = new SAXBuilder();// 使用解析器構建 XML 文檔對象Document document = builder.build(JdomReadExample.class.getClassLoader().getResourceAsStream("example.xml"));// 獲取 XML 文檔的根元素Element root = document.getRootElement();// 遍歷根元素下的所有 "book" 元素，并輸出每本書的信息for (Element book : root.getChildren("book")) {// 獲取書籍的標題、作者和年份String title = book.getChildText("title");String author = book.getChildText("author");String year = book.getChildText("year");// 打印輸出書籍信息System.out.println("Title: " + title + ", Author: " + author + ", Year: " + year);}}
}