从tomcat乱码问题中学习Java编码
项目在jetty中运行正常,打包到tomcat中,发现项目有的页面出现乱码。好像之前部署的时候也出现过这个BUG,但是当时不是这个项目,也不是我解决的。刚好趁这次回顾一下以前学习的编码知识。
关于为什么要编码:计算机中存储信息的最小单元是一个字节,8bit(0~255),人类要表示的符号太多,无法用一个字节完全表示,则有一个新的数据结构Char到byte的编码。
JAVA中经常遇到几种编码格式的区别:ASCII,ISO-8895-1,GB2312,GBK,UTF-8,UTF-16看作字典,规定了转换规则。
Java中需要编码的场景:1.I/O操作中存在编码(磁盘和网络I/O),InputStreamReader类是关联字节到字符的桥梁,负责I/O过程中字节到字符的转换,具体转换委托给StreamDecoder解码,其中由用户指定编码格式;2.内存操作中的编码。
Java中需要编码的数据:用户从浏览器发起一个HTTP请求,存在编码的地方是URL,Cookie,Parameter.服务器端要解析HTTP协议,其中URI.COOKIE.POST表单参数要解码,服务器端可能要读取数据库中的数据——本地或网络中其他地方的文本文件,都存在编码问题。
通常可以将常见的乱码问题分为JSP页面显示中文乱码、表单提交乱码两类。
JSP页面中显示中文乱码:在JSP文件中使用page命令指定响应结果的MIME类型,如<%@ page language="java" contentType="text/html;charset=gb2312" %>
表单提交乱码: 主要是因为服务器处理编码的方式和页面提交方式(post和get)不同。以tomcat为例,tomcat处理提交的参数时默认的是iso-8859-1,使用request.getParameter方法会得到乱码。换句话说:tomcat默认将单字节作为一个字符,但是中文是2个或者3个字节表示一个字符。
tomcat遇到的常见问题解决方式。
对于post方式:解决办法是编写一个过滤器统一处理post请求,过滤器在用户提交的数据被处理之前被调用。
对于get方式:这是我所遇到的情况。tomcat对post和get的处理方法不一样,所以过滤器不能解决get的乱码问题,它需要在其他地方设置。解决方法是打开<tomcat_home>\conf目录下server.xml文件,找到对8080端口进行服务的Connector组件的设置部分,给这个组件添加一个属性:URIEncoding="UTF-8"。注意修改后重新启动tomcat才能起作用。
为什么get方式要这样处理?因为客户端发送过来的请求,tomcat对url编码会判断server.xml中没有设置URIEncoding,如果有设置,则用设置的编码方式,否则用tomcat默认的即iso-8859-1(iso-8859-1)。我遇到的也是因为get中参数提交的时候出现以上情况。
参考:深入分析java web技术内幕 第3章 深入分析Java Web中的中文编码问题
http://nileader.blog.51cto.com/1381108/384353
http://zhuzhsh.iteye.com/blog/251743
- 字符集编码以及java乱码问题学习总结
- 解决java乱码的问题的两种方式tomcat编码修改
- 乱码编码问题学习小结(包括Java)
- Eclipse,tomcat及jsp-java编码的设定解决的中文乱码问题
- jsp,java中文乱码问题另类解决方案,jni加密、解密编码
- 关于乱码的问题--Tomcat的编码修改
- 编码字符集与Java -Java World乱码问题根源之所在
- JAVA ,SSH中文及其乱码问题的解决 6大配置点 使用UTF-8编码
- java web 学习笔记 编码问题总结
- Android(java)学习笔记212:中文乱码的问题处理(qq登录案例)
- JAVA web开发中的编码问题-解决乱码问题
- tomcat编码乱码问题
- java编码问题(中文乱码的原因)
- java web,charset编码设置正确情况下出现部分中文正常,部分中文乱码的问题
- Java : eclipse 编码设置 中文注释乱码问题
- java;jsp;tomcat;mysql;hibernate;j2ee 编码中文乱码全面解决方案
- [-JAVA学习-] tomcat打不开中文文件的问题
- java web,charset编码设置正确情况下出现部分中文正常,部分中文乱码的问题
- ★★ 编码字符集与Java -Java World乱码问题根源之所在
- 转:编码字符集与Java -Java World乱码问题根源之所在。