Python怎么读取XML的节点内容_Python读取XML节点内容实战教程

使用xml.etree.ElementTree可解析XML,首先通过ET.parse()读取文件并获取根节点root,接着用root.findall()遍历book子节点,利用find()获取title、author、price等元素的文本内容,同时通过get()方法提取属性如id,支持.//语法进行递归查找,注意处理节点不存在情况及字符串转数值类型。

Python读取XML节点内容主要通过内置的xml.etree.ElementTree模块实现,操作简单且无需安装第三方库。本文带你一步步实战解析XML文件中的节点内容。

1. 准备一个XML文件

假设我们有一个名为books.xml的文件,内容如下:



  
    Python入门教程
    张三
    59.90
  

  
    数据分析实战
    李四
    78.50
  

2. 读取XML并解析根节点

使用ElementTree.parse()加载XML文件,获取根元素:

import xml.etree.ElementTree as ET

tree = ET.parse('books.xml')
root = tree.getroot()

print("根节点标签:", root.tag) # 输出: library

3. 遍历子节点并提取内容

通过遍历root的子元素,访问每个book节点的内容:

for book in root:
    print(f"书籍ID: {book.get('id')}")
    print("书名:", book.find('title').text)
    print("作者:", book.find('author').text)
    print("价格:", book.find('price').text)
    print("-" * 20)

输出结果:

书籍ID: 1
书名: Python入门教程
作者: 张三
价格: 59.90
--------------------
书籍ID: 2
书名: 数据分析实战
作者: 李四
价格: 78.50
--------------------

4. 查找特定节点(模糊匹配)

如果只想获取所有节点,可以直接用findalliter

titles = root.findall('.//title')
for t in titles:
    print(t.text)

输出所有书名。其中.//title表示递归查找所有title节点。

注意点:

  • 确保XML文件路径正确,否则会报FileNotFoundError
  • 使用.find()时,若节点不存在会返回None,调用.text会出错,建议先判断是否存在
  • 文本内容默认是字符串类型,数值需手动转换,如float(book.find('price').text)

基本上就这些。掌握getroot()find()findall().text这几个核心方法,就能轻松处理大多数XML读取需求。