详谈java编码互转(application/x-www-form-urlencoded)
本质上来说,java.net.UrlEncoder适用于将String转换为application/x-www-form-urlencodedMIME格式的静态方法时,使用
但!一般情况下,web应用中,当你的服务器,页面编码,请求时编码都已经修改为utf-8后,依然乱码时,此时则应试着用下方所写到的方法
使用URLDecoder将所乱码的数据进行解码,
而在此处简单说一下乱码的场景和简单转换时的执行原理:
首先,form表单提示数据时,默认Content-type:为application/x-www-form-urlencoded,
当然也可以是:multipart/form-data,multipart/form-data一般用做form表单以流的形式提交数据时,则设置,enctype为该form-data形式,
不过呢,一般情况下,本宝宝桑面提到了,提交方式为application/x-www-form-urlencoded,当环境等等都已经配置为统一编码后,仍然出现汉字
传到后台被解码处理的情况时(也就是所谓的乱码),此时可以尝试,该文下面所提到的方法,使用URLDecoder进行解码再转换,然后转换为汉字,
当然在使用场景上,其实还是有很多情况下需要区分的,当然也是必须严格按照格式来做相对应的处理也才是最正确的方法,目前有些事情需要处理一下
先到这里喽,^_^bye
java 使用URLDecoder和URLEncoder对中文进行处理
一URLEncoder
HTML格式编码的实用工具类。该类包含了将String转换为application/x-www-form-urlencodedMIME格式的静态方法。有关HTML格式编码的更多信息,请参阅HTML规范。
对String编码时,使用以下规则:
字母数字字符"a"到"z"、"A"到"Z"和"0"到"9"保持不变。
特殊字符"."、"-"、"*"和"_"保持不变。
空格字符""转换为一个加号"+"。
所有其他字符都是不安全的,因此首先使用一些编码机制将它们转换为一个或多个字节。然后每个字节用一个包含3个字符的字符串"%xy"表示,其中xy为该字节的两位十六进制表示形式。推荐的编码机制是UTF-8。但是,出于兼容性考虑,如果未指定一种编码,则使用相应平台的默认编码。
例如,使用UTF-8编码机制,字符串"Thestringü@foo-bar"将转换为"The+string+%C3%BC%40foo-bar",因为在UTF-8中,字符ü编码为两个字节,C3(十六进制)和BC(十六进制),字符@编码为一个字节40(十六进制)。