XSLT怎么从一个字符串中解析出XML(parse-xml)

XSLT 3.0 提供 parse-xml() 函数将良构 XML 字符串转为文档节点,要求字符串格式良好、不支持 DTD/外部实体,需配合 try/catch 处理异常,XSLT 2.0 不支持。

XSLT 本身不能直接“解析”任意字符串为 XML(比如像 JavaScript 的 DOMParser 那样),但自 XSLT 3.0 起,标准提供了 parse-xml() 函数,专门用于将**格式良好的 XML 字符串**安全地转换为可操作的树结构(即一个文档节点)。

parse-xml() 的基本用法

该函数接收一个字符串参数,返回一个文档节点(document-node())。前提是字符串内容必须是良构(well-formed)的 XML,否则会抛出运行时错误(如 XPDY0002)。

示例:

AB'"/>



  

常见注意事项和限制

parse-xml() 是纯函数,不支持 DTD、外部实体、命名空间前缀绑定(除非字符串中已声明)、XML 声明中的编码声明(实际只按 UTF-8 或 UTF-16 处理)等高级特性。它只做语法解析,不进行验证。

  • 字符串中不能含未转义的 &,必须是合法 XML 文本(例如 zuojiankuohaophpcn 表示字面小于号)
  • 不能解析 HTML;若需处理 HTML,应使用 parse-html()(XSLT 3.0+,需处理器支持)
  • 若字符串来自不可信来源,建议先用 try/catch 包裹,避免崩溃

配合 try/catch 安全使用(XSLT 3.0)

当输入可能非法时,用 xsl:try 捕获解析失败:


  
  
  
    Invalid XML: 
  

兼容性提醒:XSLT 2.0 不支持 parse-xml()

如果你用的是 XSLT 2.0 处理器(如 older Saxon-B、Xalan),parse-xml() 不可用。此时只能依赖处理器扩展函数(如 Saxon 9.1+ 的 saxon:parse()),或把解析逻辑前置到宿主语言(Java/Python)中完成。

确认版本:检查你使用的处理器是否支持 XSLT 3.0(推荐 Saxon-HE 10+、Saxon-PE/EE 9.8+ 或 newer)。

基本上就这些。核心是:字符串要合法、用对版本、加好异常处理——parse-xml 就很可靠。