Python如何解析SVG文件并提取路径数据

Python解析SVG路径的核心是用xml.etree.ElementTree提取的d属性字符串,再用svgpathtools解析为几何对象以支持变换、采样和坐标计算。

Python解析SVG文件并提取路径数据,核心是读取XML结构、定位元素、解析其d属性中的路径指令。常用且轻量的方法是用内置的xml.etree.ElementTree(标准库),配合正则或专用解析器处理d字符串;若需更健壮支持(如转换坐标、处理变换、兼容复杂SVG),可选用svgpathtoolslxml

用ElementTree提取所有path的d属性

这是最直接的方式,适合结构清晰、无嵌套变换的SVG。SVG本质是XML,ElementTree能快速遍历节点。

  • ET.parse()加载文件或ET.fromstring()加载字符串
  • 用XPath .//path 查找全部元素
  • 逐个获取elem.get('d'),得到原始路径指令字符串(如"M10,20 L30,40 C50,60,70,60,90,40"

注意:d值可能含空格、逗号、大小写字母(大小写含义不同),不建议手动拆分,后续需专门解析。

用svgpathtools解析d字符串为几何对象

svgpathtools专为路径设计,能把d字符串转成可计算的Python对象(如LineCubicBezierArc),支持坐标变换、长度计算、采样等。

  • 安装:pip install svgpathtools
  • 对每个d字符串调用parse_path(d_str),返回Path对象
  • Path可迭代,每个元素是具体曲线类实例,含startend、控制点等属性
  • 支持path.translated()path.rotated()等,自动处理transform属性(需提前提取并传入)

示例:提取首条路径的起点坐标:path = parse_path(d); print(path[0].start)(复数类型,实部x、虚部y)。

处理transform和坐标系变换

真实SVG中,常嵌套在带transform或自身有transform属性,原始坐标需变换才能对应实际位置。

  • ElementTree递归向上查找父级transform属性,合并矩阵
  • svgpathtoolsparse_path()支持transform参数(接受2×3仿射矩阵),可一次性应用
  • 若用lxml,可借助cssselect或XPath更灵活定位带属性的节点,但需额外安装

简单场景下,若忽略transform,提取的坐标是局部未变换的,仅适用于无变换或已扁平化的SVG。

进阶:提取路径后导出为其他格式(如坐标点列)

很多用途(如CNC、绘图机器人、数据可视化)需要把路径转为离散点序列。

  • svgpathtools.Path.deduplicate()去重相近点
  • 调用path.point(t)沿参数t ∈ [0,1]采样(均匀t不一定均匀弧长)
  • 更准确用path.arclength() + path.locate()做等距采样
  • 最终用[complex_to_tuple(p) for p in points]转为(x, y)元组列表

例如生成100个近似等距点:points = [path.point(i/99) for i in range(100)],再用np.array(points).real.imag分离x/y。