python使用正则表达式解析http url
2016-09-22 17:07
726 查看
http Get的原文
/alter?user=abcde&pwd=123456
step1
找到匹配的http path( alter ),同时命名为url_path
step2
匹配query-string .并命名为query
step3
匹配user
step4
匹配pwd,其中?为非贪婪模式.
运行结果:
/alter?user=abcde&pwd=123456
re.compile(r'/(?P<url_path>alter)\?(?P<query>user=(?P<user>[a-zA-Z]{5,10})&pwd=(?P<passwd>(?:\d|\w){6,}?))$')
step1
(?P<url_path>alter)
找到匹配的http path( alter ),同时命名为url_path
step2
(?P<query>user=(?P<user>[a-zA-Z]{5,10})&pwd=(?P<passwd>(?:\d|\w){6,}?))
匹配query-string .并命名为query
step3
user=(?P<user>[a-zA-Z]{5,10})
匹配user
step4
pwd=(?P<passwd>(?:\d|\w){6,}?)
匹配pwd,其中?为非贪婪模式.
运行结果:
>>> p=re.compile(r'/(?P<url_path>alter)\?(?P<query>user=(?P<user>[a-zA-Z]{5,10})&pwd=(?P<passwd>(?:\d|\w){6,}?))$') >>> p.match('/alter?user=liujxc&pwd=123456').groups() ('alter', 'user=liujxc&pwd=123456', 'liujxc', '123456')
相关文章推荐
- 使用正则表达式对URL进行解析
- python3.4学习笔记(十二) python正则表达式的使用,使用pyspider匹配输出带.html结尾的URL
- 使用python和正则表达式获取url,及总结
- python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。
- python使用正则表达式提取网页URL的方法
- 使用正则表达式解析URL
- javascript 正则表达式 一个 匹配和解析url的
- [C#][固定格式网页解析]使用正则表达式处理网页的初步体会
- PYTHON正则表达式 re模块使用说明
- C#中使用正则表达式验证Email格式、IP地址格式和URL网址格式
- C#中使用正则表达式验证Email格式、IP地址格式和URL网址格式
- Python正则表达式操作指南(re使用)(转)
- 万能Url正则表达式[http,ftp,news,telnet.....]——史上最全Url正则表达式(基于RFC1738)
- [C#][固定格式网页解析]使用正则表达式处理网页的初步体会
- 比较详细Python正则表达式操作指南(re使用)
- 在VC6中使用正则表达式解析字符串
- [C#][固定格式网页解析]使用正则表达式处理网页的初步体会
- [C#][固定格式网页解析]使用正则表达式处理网页的初步体会
- 使用Python正则表达式从文章中取出所有图片路径