python Xpath语法的使用

时间:2021-05-22

一、XMl简介

(一)什么是 XML

XML 指可扩展标记语言(EXtensible)
XML 是一种标记语言,很类似 HTML。
XML 的设计宗旨是传输数据,而非显示数据。
XML 的标签需要我们自行定义。
XML 被设计为具有自我描述性。
XML 是 W3C 的推荐标准。
W3School 官方文档:http://']# 例如: 获取所有包含src属性的标签之间的内容# node = html.xpath('//*[@src]/text()')# print(node) # ['Harry Potter', '水浒传', '三国演义']# 3.4 and 与 连接的是谓语(条件)# 例如: 获取lang="dng"并且class="t1"的title标签的内容# title = html.xpath('//book/title[@lang="dng" and @class="t1"]/text()')# title1 = html.xpath('//book/title[@lang="dng"][@class="t1"]/text()')# print(title) # ['三国演义']# print(title1) # ['三国演义']# 3.5 or 或 连接谓语# 例如: 查找lang="cng"或者lang="bng"的title标签的内容# title = html.xpath('//book/title[@lang="cng" or @lang="bng"]/text()')# print(title) # ['Harry Potter', '西游记']# 3.6 | 连接路径# 例如: 获取所有title标签和price标签之间的内容# title = html.xpath('//title/text() | //price/text()')# print(title) # ['Harry Potter', '29.99', 'Learning XML', '39.95', '西游记', '69.95', '水浒传', '29.95', '三国演义', '29.95']# 3.8 parse() 作用:从文件中读取数据# 注意: 读取的文件,必须满足xml格式**(不存在单标签,全部都是上标签)**content = etree.parse('test.html')# print(content) # <lxml.etree._ElementTree object at 0x000001DC5CF5ED08>res = etree.tostring(content,encoding='utf-8')print(res.decode()) <!DOCTYPE html><html lang="en"><head> <title>test</title></head><body> <h1> 这是一个html </h1></body></html>

到此这篇关于python Xpath语法的使用的文章就介绍到这了,更多相关python Xpath语法内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章