您的位置:首页 > 编程语言 > Java开发

struts2中<s:url>中文自动编码问题

2015-06-09 10:43 771 查看
struts2中,如果使用<s:url>,直接放进地址栏,如果有中文的话,会发生一个自动编码。那么我们在后台如何将这已经编码的数据解码出来呢?当然,说的是中文传输。

<span style="font-size:14px;"><a href="
<s:url value='demo.action'>
<s:param name='fileName' value='fileFileName[#fn.getIndex()]'/>
</s:url>">点击我
</a></span>


譬如上面的这段代码,点击链接,然后发现地址栏出现了一串编码了的字符串,当然这前提是fileName这里面包含了中文。然后,我在后台进行了解码。

首先,我用的是String fn = new String(fileName.getBytes("ISO-8859-1"), "utf-8");这种方法来解码,发现解码不出来。

于是,我又用了java.net.URLDecoder.decode(fileName,"utf-8");还是解码不了。

后来我居然用String fn = new String(fileName.getBytes("ISO-8859-1"), "gbk");给搞定了。

问题来了,utf-8和gbk都是中文编码,为什么一个可以,一个又不可以了呢?我查一些资料,我个人猜测,应该这两种编码占用的字节大小的关系。ISO-8859-1属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。
很明显,ISO-8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候, 仍旧使用ISO-8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然"中文"两个字不存在ISO-8859-1编码,以gb2312编码为例,应该是"d6d0   cec4"两个字符,使用ISO-8859-1编码的时候则将它拆开为4个字节来表示:"d6 d0 ce c4"(事实上,在进行存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节"e4
b8 ad e6 96 87"。很明显,这种表示方法还需要以另一种编码为基础。


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  struts2 jsp url 编码