Ruby如何处理xml数据 Nokogiri库的安装与核心用法

最常用工具是Nokogiri库,支持XML和HTML解析、搜索与修改,安装通过gem install nokogiri或添加至Gemfile,需注意系统依赖如libxml2,在Ubuntu上用apt-get安装必要开发包。

Ruby 处理 XML 数据最常用、最强大的工具是 Nokogiri 库。它支持 XML 和 HTML 的解析、搜索和修改,接口清晰,性能优秀。下面介绍 Nokogiri 的安装方式及其核心用法。

安装 Nokogiri

Nokogiri 是一个 Ruby gem,可通过以下命令安装:

gem install nokogiri

如果你使用 Bundler 管理项目依赖,在 Gemfile 中添加:

gem 'nokogiri'

然后运行:

bundle install

安装过程中可能会提示缺少系统依赖(如 libxml2、libxslt),在 Linux 或 macOS 上可使用包管理器安装。例如在 Ubuntu 上:

sudo apt-get install build-essential patch ruby-dev zlib1g-dev liblzma-dev libxml2-dev libxslt1-dev

解析 XML 数据

Nokogiri 可以轻松解析字符串或文件中的 XML 内容。

示例 XML 字符串:

xml_data =

Ruby 入门
张三


Rails 实战
李四


XML

使用 Nokogiri 解析:

require 'nokogiri'

doc = Nokogiri::XML(xml_data)
puts doc.class # => Nokogiri::XML::Document

查询与遍历节点

Nokogiri 支持通过 CSS 选择器或 XPath 查询节点。

  • 使用 CSS 选择器获取所有 book 节点:
books = doc.css('book')
books.each do |book|
puts "ID: #{book['id']}"
puts "标题: #{book.at_css('title').content}"
puts "作者: #{book.at_css('author').content}"
end
  • 使用 XPath 查询(更灵活):
titles = doc.xpath('//book/title')
titles.each { |t| puts t.text }
  • 获取属性值:
book_id = doc.at_xpath('//book/@id').value # 获取第一个 book 的 id

修改与构建 XML

Nokogiri 也支持修改现有文档或创建新 XML。

  • 修改某个节点内容:
title_node = doc.at_css('book[id="1"] title')
title_node.content = 'Ruby 进阶指南'
  • 添加新节点:
new_book =
Nokogiri 使用手册
王五

XML

doc.root.add_child(new_book)
  • 输出修改后的 XML:
puts doc.to_xml

基本上就这些。Nokogiri 让 Ruby 操作 XML 变得简单高效,无论是读取配置、处理接口数据还是生成报告,都能胜任。熟悉 CSS 和 XPath 语法能大幅提升使用体验。不复杂但容易忽略细节,比如命名空间或编码问题,需根据实际情况调整解析选项。