您的位置：首页 > 编程语言 > Python开发

Python 华理教学周

2016-06-04 21:16 645 查看

找

对于我等学渣来说，现在是第几周，向来搞不清的

于是想写个程序来看是第几周

先右键检查元素

看到15了并且还有href 和 style 属性

再Ctrl + U看下源代码

结果并没有找到这一段说明是后来加载了

于是我就找啊找，结果发现是iframe加载的

那好办了，直接访问src就是了

这个网页真是言简意赅

看下源码

看到15了可以开始编程了

写

>>> import requests
>>> url = 'http://59.78.108.73/jwc/index.php'
>>> html = requests.get(url).text

这首先引入request 因为我装的是了anaconda，所以就自带了

然后html就是url的全部html字符串，i.e.上图

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup(html, "lxml")

这里使用了BeautifulSoup这个库，用来解析html，与jsoup类似

关于BeatuifulSoup可以看这个文档，有中文

后面的lxml是xml解析器什么的，文档上直接

soup = BeautifulSoup(html)

这会报一个Warning，大概意思是没指定xml解析器不同的机器就会用不同的xml解析器来解析。

>>> doc = soup.select('a[herf="http://jwc.ecust.edu.cn/s/75/t/134/p/12/c/4053/list.htm"]')

这时我们用css选择器的语法把15找出来

但此时得到的doc是一个list

所以还要用doc[0]这种写法

>>> doc[0].text
u'15'
>>> print doc[0].text
15

这样就把当前周给找出来了

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

Python 华理 教学周

找

写

Python 华理教学周