ASP.NET 判断网页编码读取内容,防止乱码
2010-05-07 09:58
253 查看
最近要写一个在网页中查找关键字及链接的程序,在输出到TextBox的时候发现经常出现乱码,整理了一下根据不同的编码选取网页源文件,目前可以解决几种常编码方式的网页,感兴趣的可以试下。
本来想用“==”判断编码,感觉比较麻烦,所以改用比较模糊的方法,Contains用在这里挺方便的。
Contains说明:就是返回一布尔值,指示是否当前字符串实例包含给定的子串。
本来想用“==”判断编码,感觉比较麻烦,所以改用比较模糊的方法,Contains用在这里挺方便的。
Contains说明:就是返回一布尔值,指示是否当前字符串实例包含给定的子串。
//存放网页的源文件 string all_code = ""; HttpWebRequest all_codeRequest = (HttpWebRequest)WebRequest.Create(web_url); WebResponse all_codeResponse = all_codeRequest.GetResponse(); string contenttype = all_codeResponse.Headers["Content-Type"];//得到结果为"text/html; charset=utf-8" //网页编码判断 if (contenttype.Contains("gb2312")) { StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream(), Encoding.GetEncoding("GB2312")); //获取源文件 all_code = the_Reader.ReadToEnd(); the_Reader.Close(); } else if (contenttype.Contains("gbk")) { StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream(), Encoding.GetEncoding("GBK")); //获取源文件 all_code = the_Reader.ReadToEnd(); the_Reader.Close(); } else if (contenttype.Contains("utf-8")) { StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream(), Encoding.GetEncoding("UTF-8")); //获取源文件 all_code = the_Reader.ReadToEnd(); the_Reader.Close(); }
相关文章推荐
- asp.net 后台判断显示,读取数据库内容
- html中读取asp.net向Cookie中写入的中文内容
- asp.net GridView 判断数据绑定内容
- asp.net 写入中文cookie JS读取乱码
- ASP.NET C#如何读取word,写入word,复制内容到另一个word文档,批量修改文件名
- asp.net读取excel内容并将数据捞进DATASET中
- asp.net读取txt文件内容
- ASP.NET中读取Excel内容,并显示在界面上
- js前台编码,asp.net后台解码 防止前台传值到后台为乱码
- 在asp.net mvc中使用百度UEditor初始化内容遇到自数据库中读取的html字符串在UEditor中始终是html编码的问题
- 在Asp.net的HttpCookie中写入汉字,读取时为乱码的解决方法!
- 读取text文档中文内容乱码以及string中文编码判断
- ASP.NET访问网址并读取响应的内容
- asp.net 读取xml节点下的内容
- ASP.NET中读取Excel内容,并显示在界面上
- [转]ASP.NET C#如何读取word,写入word,复制内容到另一个word文档,批量修改文件名
- asp.net 读取xml文件里面的内容,绑定到dropdownlist中
- Asp.Net 读取Excel内容超过255个字符被截断
- ASP.NET实现读取Excel内容并在Web上显示
- ASP.NET中读取Excel内容,并显示在界面上