您的位置:首页 > 理论基础 > 计算机网络

R网络爬虫之表格下载

2015-05-06 11:24 281 查看
#XML的缺点是对中文支持不够好

library(RCurl)
library(XML)
url="http://data.earthquake.cn/datashare/globeEarthquake_csn.html"
wp=getURL(url)
doc=htmlParse(wp,asText=T)
tables=readHTMLTable(doc,header=F,which=6)
#基于html中的关键字"table"进行筛选,"which=6”表示第6个表单
tables
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: