lxml 模块下 xpath 的使用
2015-11-15 22:51
363 查看
为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言
相对于正则表达式 ,xpath作为一种为了解析xml的一门语言,用于对网页的解析,自然十分有效率。
导入方式 from lxml import etree// 用于建立初始根节点
/ 用于向下层寻找
@xxx 用于提取属性内容
@ text() 用于提取文本内容
xpath路径可以手动寻找 也可以借助工具进行寻找
这里推荐使用chrome 浏览器 F12 打开开发者工具,选择对应位置 右键Copy即可得到
一般使用先抓大 再抓小的方式 匹配对象
以相同字符开头 start s-with
html.xpath(‘div[starts-with(@id,’test’)]/text()’)该代码意为:匹配div标签下的所有有test字符的代码行中的文本内容
标签套标签
相关文章推荐
- 你应该学习哪种编程语言?
- [转]我们需要一种其他人能使用的编程语言
- C#语言主要特性总结
- C语言中static的作用及C语言中使用静态函数有何好处
- PHP检测用户语言的方法
- C#通过xpath查找xml指定元素的方法
- JavaScipt基本教程之JavaScript语言的基础
- xpath的数据和节点类型以及XPath中节点匹配的基本方法
- c#通过xpath读取xml示例
- JQuery 选择器 xpath 语法应用
- 深入XPath的详解以及Java示例代码分析
- htmlcleaner使用方法及xpath语法初探
- 各种语言、服务器301跳转代码全集
- 查看Java所支持的语言及相应的版本信息
- 使用php判断浏览器的类型和语言的函数代码
- php实现获取及设置用户访问页面语言类
- GO语言类型转换和类型断言实例分析
- php根据用户语言跳转相应网页
- Java基础知识之Java语言概述