您的位置：首页 > 编程语言 > ASP

ASP.NET 判断网页编码读取内容，防止乱码

2010-05-07 09:58 253 查看

最近要写一个在网页中查找关键字及链接的程序，在输出到TextBox的时候发现经常出现乱码，整理了一下根据不同的编码选取网页源文件，目前可以解决几种常编码方式的网页，感兴趣的可以试下。

本来想用“＝＝”判断编码，感觉比较麻烦，所以改用比较模糊的方法，Contains用在这里挺方便的。

Contains说明：就是返回一布尔值，指示是否当前字符串实例包含给定的子串。

//存放网页的源文件
string all_code = "";

HttpWebRequest all_codeRequest = (HttpWebRequest)WebRequest.Create(web_url);
WebResponse all_codeResponse = all_codeRequest.GetResponse();

string contenttype = all_codeResponse.Headers["Content-Type"];//得到结果为"text/html;   charset=utf-8"

//网页编码判断
if (contenttype.Contains("gb2312"))
{
StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream(), Encoding.GetEncoding("GB2312"));
//获取源文件
all_code = the_Reader.ReadToEnd();
the_Reader.Close();
}
else if (contenttype.Contains("gbk"))
{
StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream(), Encoding.GetEncoding("GBK"));
//获取源文件
all_code = the_Reader.ReadToEnd();
the_Reader.Close();
}
else if (contenttype.Contains("utf-8"))
{
StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream(), Encoding.GetEncoding("UTF-8"));
//获取源文件
all_code = the_Reader.ReadToEnd();
the_Reader.Close();
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航