Jsoup抓取页面内容
2014-06-04 11:23
507 查看
package com.myjsoup;
import java.io.IOException;
import java.util.Iterator;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args){
getInfo("00015");
}
private static void getInfo(String num) {
String text="";
String urlStr="http://www.aastocks.com/SC/LTP/RTQuote.aspx?&symbol="+num;
try {
Document doc = Jsoup.connect(urlStr).data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.post();
Element body=doc.body();
System.out.println("股票名:"+body.getElementsByAttributeValue("class", "floatL f15").text());//获得股票名
System.out.println("现价:"+body.getElementsByAttributeValue("class", "C font28 C bold").get(0).child(0).text());//获得现价
//判断升跌
String src=body.getElementsByAttributeValue("class","C font20 bold").get(0).child(0).attr("src");
if(src.indexOf("r.gif")!=-1){
text="跌";
}else{
text="升";
}
System.out.println(text+":"+body.getElementsByAttributeValue("class", "C font20 bold").get(0).child(1).text());//获得升跌
System.out.println(text+":"+body.getElementsByAttributeValue("class", "C font20 bold").get(1).child(1).text());//获得升跌(%)
Elements p2=body.getElementsByAttributeValue("class", "floatR p2");//获得所有p2元素
System.out.println("成交量:"+p2.get(0).text());
System.out.println("市值:"+p2.get(1).text());
System.out.println("成交金额:"+p2.get(2).text());
System.out.println("每股盈利:"+p2.get(3).text());
System.out.println("市盈率(倍):"+p2.get(4).text());
System.out.println("收益率:"+p2.get(5).text());
System.out.println("每手股数:"+p2.get(6).text());
System.out.println("今日波幅:"+p2.get(8).text());
System.out.println("52周波幅:"+p2.get(9).text());
} catch (Exception e) {
e.printStackTrace();
}
}
}
package com.myjsoup;
import java.io.IOException;
import java.util.Iterator;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Main {
public static void main(String[] args){
getInfo("00015");
}
private static void getInfo(String num) {
String text="";
String urlStr="http://www.aastocks.com/SC/LTP/RTQuote.aspx?&symbol="+num;
try {
Document doc = Jsoup.connect(urlStr).data("query", "Java")
.userAgent("Mozilla")
.cookie("auth", "token")
.timeout(3000)
.post();
Element body=doc.body();
System.out.println("股票名:"+body.getElementsByAttributeValue("class", "floatL f15").text());//获得股票名
System.out.println("现价:"+body.getElementsByAttributeValue("class", "C font28 C bold").get(0).child(0).text());//获得现价
//判断升跌
String src=body.getElementsByAttributeValue("class","C font20 bold").get(0).child(0).attr("src");
if(src.indexOf("r.gif")!=-1){
text="跌";
}else{
text="升";
}
System.out.println(text+":"+body.getElementsByAttributeValue("class", "C font20 bold").get(0).child(1).text());//获得升跌
System.out.println(text+":"+body.getElementsByAttributeValue("class", "C font20 bold").get(1).child(1).text());//获得升跌(%)
Elements p2=body.getElementsByAttributeValue("class", "floatR p2");//获得所有p2元素
System.out.println("成交量:"+p2.get(0).text());
System.out.println("市值:"+p2.get(1).text());
System.out.println("成交金额:"+p2.get(2).text());
System.out.println("每股盈利:"+p2.get(3).text());
System.out.println("市盈率(倍):"+p2.get(4).text());
System.out.println("收益率:"+p2.get(5).text());
System.out.println("每手股数:"+p2.get(6).text());
System.out.println("今日波幅:"+p2.get(8).text());
System.out.println("52周波幅:"+p2.get(9).text());
} catch (Exception e) {
e.printStackTrace();
}
}
}
相关文章推荐
- Java - 抓取优酷网视频播放页面(使用jsoup解析html,正则表达式处理字符串)
- 新浪新闻页面抓取(JAVA-Jsoup)
- 使用jsoup解析html页面内容案例
- PHP CURL模拟登录新浪微博抓取页面内容 基于EaglePHP框架开发
- jsoup通过获取的内容写自己的页面
- 使用jsoup爬虫抓取页面
- python 模拟抓取手机访问页面内容今天
- 使用phpQuery 抓取HTML 页面内容
- 使用java的html解析器jsoup和jQuery实现一个自动重复抓取任意网站页面指定元素的web应用
- 使用Jsoup 抓取页面的数据
- java-jsoup解析html页面的内容
- 利用curl抓取远程页面内容的示例代码
- 使用Jsoup函数包抓取网页内容
- 使用Jsoup抓取京东图书分类页面图书信息
- 绕过ROBOTS规则,转向页面抓取配置,内容大小限制
- Jsoup学习-使用Jsoup抓取页面数据
- 用C#抓取AJAX页面的内容
- win10终端如何使用curl命令来抓取页面源码和内容
- PHP cURL库函数抓取页面内容(转)
- 使用Jsoup 异步抓取页面的数据