R语言rvest包爬取当当网单个商品的商品id,品牌,价格等商品属性
2016-10-02 14:59
543 查看
直接上代码吧! 本文章的例子仅用于学习之用,如涉及版权隐私信息,请联系本人删除,谢谢
# install.packages("rvest") library(rvest) url<-"http://product.dangdang.com/1328241371.html#ddclick?act=click&pos=1328241371_36_1_m&cat=4001075&key=&qinfo=&pinfo=&minfo=4438_2_48&ninfo=&custid=&permid=&ref=&rcount=&type=&t=1475383245000&searchapi_version=test_new" # 解析商品单页 web<-read_html(url,encoding = "gbk") # 获取商品参数内容 content<-web%>% html_nodes("div.main")%>% html_nodes("div.mall_goods_foursort_style")%>% html_nodes("div")%>% html_text() # 商品品牌 brand<-substr(content[2],4,nchar(content[3])) # 商品id id<-substr(content[3],4,nchar(content[3])) # 商品价格 price<-web%>% html_nodes("div.sale")%>% html_nodes("div")%>% html_nodes("div")%>% html_nodes("b.d_price")%>% html_nodes("span")%>% html_text() item<-data.frame(brand=brand,id=id,price=price)
相关文章推荐
- R语言rvest包4步爬取当当网某一商品类目下的所有商品属性信息
- 商品管理系统--分类、品牌、属性、商品、价格、图片管理
- 商品管理系统--分类、品牌、属性、商品、价格、图片管理
- 属性动画+购物车+全选反选+选中计算价格+单个删除
- ECSHOP 如何删除商品列表页 购买弹出 商品属性框后面的价格
- 定义一个计算机类:属性:品牌;价格;颜色; 方法:(1)编程的功能 (2)上网的功能 实例化两个对象:“lenovo”;“hasee”
- 淘宝、亚马逊、京东商城、Magento系统在商品多属性、多价格、多语言、多库存、多供应商研究
- Ecshop商品属性无法正常使用价格排序的问题
- 根据商品ID查询出单个商品
- 实现一个当当网商品价格查询助手
- ecshop实现商品列表页属性筛选区品牌筛选以LOGO形式展示
- 根据分类id,获取该分类下的商品数据(商品名,价格,路径,缩略图)
- 商品详情页面属性价格显示其对应价格
- ECsoop 商品列表页属性筛选区品牌以LOGO形式显示
- 当当网商家api接口取商品属性php部分代码
- 商品详情页面属性价格显示其对应价格
- ECSHOP后台自定义价格区间让ECSHOP商品属性筛选更人性化
- ecshop实现商品列表页属性筛选区品牌筛选以LOGO形式展示
- Spring配置中<bean>的id和name属性区分
- HTML中的id和name属性应用