html 中读取 标签数据
想要读取 html 中
标签中的数据,可以使用专业的框架,如 querylist。
querylist 是一个简单易用的 python 库,可以轻松地从 html 文档中提取数据。使用 querylist,你可以:
- 将 html 文档加载到一个 querylist 对象中。
- 使用 css 选择器找到所需的
标签。
- 获取每个
标签中包含的内容。
以下示例代码演示了如何使用 querylist 从 html 文档中提取
标签数据:
from querylist import QueryList html = """
第四章 医学微生物学(助理不考)
第一节 微生物的基本概念
""" ql = QueryList(html) p_tags = ql.find('p') data = [] for p in p_tags: data.append(p.text) print(data) # 输出: # ['第四章 医学微生物学(助理不考)', '第一节 微生物的基本概念']
通过使用 querylist,你可以轻松地从 html 文档中提取
标签数据,并根据标签对其进行分组。









