【Java教程】Day17-10 XML与JSON：使用SAX

在本篇教程中，我们将介绍另一种解析XML的方式——SAX。与DOM不同，SAX是一种基于事件驱动的流式解析方式，具有高效的内存管理优势。本文将详细讲解SAX解析XML的原理，并提供示例代码，帮助你更好地理解并使用SAX API。

1. SAX解析简介

SAX（Simple API for XML）是一种基于流的解析方式，与DOM不同，SAX不会将整个XML文档加载到内存中，而是通过事件回调的方式逐步解析XML。这使得SAX能够高效地处理大文件，内存占用非常小。

SAX的解析过程是流式的，意味着它一边读取XML，一边解析，并触发一系列事件。每个事件表示XML文档中的一个特定操作，如开始读取文档、读取元素、读取文本等。

2. SAX事件概述

SAX解析会触发以下几个主要事件：

startDocument：表示开始解析XML文档。

startElement：表示读取到一个开始标签（例如）。

characters：表示读取到元素的文本内容。

endElement：表示读取到一个结束标签（例如）。

endDocument：表示完成解析整个XML文档。

这些事件通过回调方式通知调用者，可以在事件发生时获取相关数据。

3. 使用SAX解析XML

以下是一个使用SAX解析XML文件的简单例子。假设我们有一个与前述相同的XML文件（book.xml）：

xml Java核心技术 Cay S. Horstmann 1234567 Java Network

在SAX解析中，主要的工作是定义一个回调类，这个回调类继承自DefaultHandler，并重写其方法来处理不同的解析事件。

SAX解析代码：

javaimport org.xml.sax.*;import org.xml.sax.helpers.*;import javax.xml.parsers.*;import java.io.InputStream;public class SAXParserExample { public static void main(String[] args) throws Exception { InputStream input = SAXParserExample.class.getResourceAsStream("/book.xml"); // 创建SAX解析器工厂 SAXParserFactory spf = SAXParserFactory.newInstance(); SAXParser saxParser = spf.newSAXParser(); // 解析XML并传入自定义的处理器 saxParser.parse(input, new MyHandler()); } // 自定义事件处理器 static class MyHandler extends DefaultHandler { // 文档开始时调用 public void startDocument() throws SAXException { print("start document"); } // 文档结束时调用 public void endDocument() throws SAXException { print("end document"); } // 元素开始时调用 public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { print("start element:", localName, qName); } // 元素结束时调用 public void endElement(String uri, String localName, String qName) throws SAXException { print("end element:", localName, qName); } // 读取文本时调用 public void characters(char[] ch, int start, int length) throws SAXException { print("characters:", new String(ch, start, length)); } // 解析错误时调用 public void error(SAXParseException e) throws SAXException { print("error:", e); } // 打印事件信息 void print(Object... objs) { for (Object obj : objs) { System.out.print(obj); System.out.print(" "); } System.out.println(); } }}

代码解析：

输入流：通过getResourceAsStream方法获取XML文件的输入流。

创建SAX解析器：SAXParserFactory.newInstance()返回一个SAX解析器工厂，通过它可以创建一个SAX解析器实例。

解析XML文件：使用SAXParser.parse()方法解析XML文件，第一个参数为输入流，第二个参数为一个自定义的事件处理器MyHandler。

回调处理：MyHandler继承自DefaultHandler，并重写了事件处理方法。每当解析器遇到不同的XML节点或内容时，会调用这些方法。

4. SAX解析的输出结果

运行上述代码后，解析器会逐步处理XML文档并打印出以下结果：

yamlstart documentstart element: bookcharacters: start element: namecharacters: Java核心技术end element: namecharacters: start element: authorcharacters: Cay S. Horstmannend element: author...

事件解释：

start document：表示文档开始解析。

start element：表示遇到开始标签，如、等。

characters：表示当前节点内的文本内容，例如书名"Java核心技术"。

end element：表示遇到结束标签，如。

end document：表示文档解析结束。

5. 如何读取元素的文本内容

在SAX中，文本内容是通过characters方法获取的，但为了知道文本属于哪个元素，通常需要通过栈来追踪当前解析的元素。当startElement方法被调用时，将当前元素压入栈中，endElement方法被调用时，弹出栈中的元素。

例如，读取节点的文本，可以在startElement中入栈，在endElement中出栈，characters方法读取文本时通过栈来确定文本属于哪个元素。

6. SAX解析的优缺点

优点：

内存占用小：由于SAX是基于流的解析方式，它不需要将整个XML文档加载到内存中，因此内存消耗非常小，适合处理大型XML文件。

解析速度快：由于SAX是逐步读取和解析XML，它的处理速度比DOM更快，特别是对于大文件。

缺点：

使用复杂：SAX需要开发者通过回调函数手动管理解析过程，对于一些较为复杂的文档结构，代码会比较复杂。

不可回溯：SAX是一次性的流式解析，一旦读取了数据，就不能回溯。这意味着如果需要多次读取同一部分内容，无法实现。

7. 小结

SAX解析XML具有内存占用小和解析速度快的优点，适合用于处理大规模XML文件。通过回调机制，SAX可以高效地解析文档，但也因此要求开发者手动管理解析过程，增加了代码的复杂性。

在实际应用中，如果你需要处理较小的XML文件，DOM可能会更方便；但当面对大文件时，SAX是一个更合适的选择。

更多创意

马超名字寓意解析

第一次表白送多少朵玫瑰花

lol艾克哪个皮肤值得买

创意伙伴