Jsoup处理html空格乱码问题
2014-06-05 11:37
417 查看
由于在html中空格只能用 表示,当运用Jsoup抓取html页面后,我们将html页面进行解析时,Java对html页面的代码不识别,输入到控制台时出现乱码,在网上查了很多资料都没有找到很好的解决办法,最后在一篇论坛中说到“运用字符串替换”可以进行解决,于是运用简单的字符串替换原理对此进行处理。对其替换处理后再对html文件进行解析。具体实现代码如下:
//参数说明:oldFile为所需要替换的文件,即为原文件; newFile为替换后新的文件 ;oldString为所需要替换的字符串;newString为替换字符串
public static void replaceAllFileString(File oldFile, File newFile, String oldString, String newString){
try {
BufferedReader reader = new BufferedReader(new FileReader(oldFile));
BufferedWriter writer = new BufferedWriter(new FileWriter(newFile));
String teamString = null;
while((teamString = reader.readLine()) != null){
String str = teamString.replaceAll(oldString, newString);
writer.write(str);
}
reader.close();
writer.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
//参数说明:oldFile为所需要替换的文件,即为原文件; newFile为替换后新的文件 ;oldString为所需要替换的字符串;newString为替换字符串
public static void replaceAllFileString(File oldFile, File newFile, String oldString, String newString){
try {
BufferedReader reader = new BufferedReader(new FileReader(oldFile));
BufferedWriter writer = new BufferedWriter(new FileWriter(newFile));
String teamString = null;
while((teamString = reader.readLine()) != null){
String str = teamString.replaceAll(oldString, newString);
writer.write(str);
}
reader.close();
writer.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
相关文章推荐
- Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
- 关于利用Jsoup解析HTML中 变成非传统空格或乱码问题解决方法
- Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
- 关于利用Jsoup解析HTML中 ;变成非传统空格或乱码问题解决方法
- 关于html改为jsp乱码问题的处理
- javawebday57(图书在页面静态化 处理html 直接存储的乱码问题)
- 抓取HTML内容的空格处理,数据库空格乱码
- 解决Jsoup解析html页面空格( )解析为乱码(问号)
- 【转载】JMeter3.0图形化HTML报告中文乱码问题处理
- 【JAVA】使用jacob生成的html,关于文字乱码处理,图片无法显示等问题。
- Jsoup解析HTML中 出现乱码问题解决办法
- Jsoup 处理 html 片段<script> 内容转义,js转换成一行问题
- 处理html页面的空格问题(DOM)
- 抓取HTML内容的空格处理,数据库空格乱码
- java处理html空格变成问号问题
- 如何解决 html 中多空格字符被当作一个空格字符处理的问题
- jsoup 的Elements.select的类 选择器 空格处理问题
- MySQL 5.0.16 乱码问题处理办法
- 项目乱码问题和处理方案
- 在java中开发Ajax过程中的乱码问题与处理