Rss订阅

首页 »Java教程 » 解决乱码:这是我们公司总结的一些关于中文乱码问题的一些解决方案和经验和大家分享！ »正文

解决乱码:这是我们公司总结的一些关于中文乱码问题的一些解决方案和经验和大家分享！

来源: 发布时间:星期四, 2009年2月12日浏览:153次评论:0

1.字节和unicode
java内核是unicode

就连

文件也是

但是很多媒体

包括文件/流

保存方式是使用字节流

因此java要对这些字节流经行转化

char是unicode

而

是字节

java中

/char互转

在sun.io

包中间有

其中ByteToCharConverter类是中调度

可以用来告诉你

你用

convertor

其中两个很常用

静态

是
public

ByteToCharConvertergetDefault

;
public

ByteToCharConvertergetConverter(Stringencoding);
如果你不指定converter

则系统会自动使用当前

encoding,gb平台上用gbk,en平台上用8859_1

——〉char:
\"你\"

gb码是:0xc4e3,unicode是0x4f60
Stringencoding=\"gb2312\";

={(

)\'\\u00c4\',(

)\'\\u00e3\'};
ByteToCharConverterconverter=ByteToCharConverter.getConverter(encoding);
charc

=converter.convertAll(b);
for(

i=0;i<c.length;i

){

.out.pr

ln(Integer.toHexString(c[i]));
}
结果是什么？0x4f60
如果encoding=\"8859_1\"

结果又是什么？0x00c4,0x00e3
如果代码改为

={(

)\'\\u00c4\',(

)\'\\u00e3\'};
ByteToCharConverterconverter=ByteToCharConverter.getDefault

;
charc

=converter.convertAll(b);
for(

i=0;i<c.length;i

){

.out.pr

ln(Integer.toHexString(c[i]));
}
结果将又是什么？根据平台

编码而定

char——〉

:
Stringencoding=\"gb2312\";
charc

={\'\\u4f60\'};
CharToByteConverterconverter=CharToByteConverter.getConverter(encoding);

=converter.convertAll(c);
for(

i=0;i<b.length;i

){

.out.pr

ln(Integer.toHexString(b[i]));
}
结果是什么？0x00c4,0x00e3
如果encoding=\"8859_1\"

结果又是什么？0x3f
如果代码改为
Stringencoding=\"gb2312\";
charc

={\'\\u4f60\'};
CharToByteConverterconverter=CharToByteConverter.getDefault

;

=converter.convertAll(c);
for(

i=0;i<b.length;i

){

.out.pr

ln(Integer.toHexString(b[i]));
}
结果将又是什么？根据平台

编码而定

很多中文问题就是从这两个最简单

类派生出来

而却有很多类不直接支持把encoding输入

这给我们带来诸多不便

很多

难得用encoding了

直接用default

encoding

这就给我们移植带来了很多困难

2.utf-8
utf-8是和unicode

对应

其实现很简单
7位

unicode:0_______
11位

unicode:110_____10______
16位

unicode:1110____10______10______
21位

unicode:11110___10______10______10______
大多数情况是只使用到16位以下

unicode:
\"你\"

gb码是:0xc4e3,unicode是0x4f60
0xc4e3

2进制:
1100

0100

1110

0011
由于只有两位我们按照两位

编码来排

但是我们发现这行不通

第７位不是0因此

返回\"?\"
0x4f60

2进制:
0100

1111

0110

0000
我们用utf-8补齐

变成:
1110

0100

1011

1101

1010

0000
e4--bd--a0
于是返回:0xe4,0xbd,0xa0

3.和

其实核心是char

,然而要把

转化成

必须经过编码

.length

其实就是char

长度

如果使用区别

编码

很可能会错分

造成散字和乱码

例如:
Stringencoding=“”;

b={(

)\'\\u00c4\',(

)\'\\u00e3\'};

Stringstr=

String(b,encoding);　　
如果encoding=8859_1

会有两个字

但是encoding=gb2312只有

个字这个问题在处理分页是经常发生

4.Reader,Writer/InputStream,OutputStream
Reader和Writer核心是char

InputStream和OutputStream核心是

但是Reader和Writer

主要目

是要把char读/写InputStream/OutputStream

例如:
文件test.txt只有

个\"你\"字

0xc4,0xe3
Stringencoding=\"gb2312\";
InputStreamReaderreader=

InputStreamReader(

FileInputStream(
\"text.txt\"),encoding);
charc

char[10];

length=reader.read(c);
for(

i=0;i<length;i

){

.out.pr

ln(c[i]);
}
结果是什么？你
如果encoding=\"8859_1\"

结果是什么？??两个

表示不认识

反过来

例子自己做

5.我们要对java编译器有所了解:
javac?encoding
我们常常没有用到encoding这个参数

其实encoding这个参数对于跨平台

操作是很重要

如果没有指定encoding

则按照系统

默认encoding,gb平台上是gb2312

英文平台上是iso8859_1

java

编译器实际上是

sun.tools.javac.

类

对文件进行编译

这个类有compile

中间有

个encoding

变量,-encoding

参数其实直接传给encoding变量

编译器就是根据这个变量来读取java文件

然后把用utf-8形式编译成

文件

例子代码:
Stringstr=\"你\";
FileWriterwriter=

FileWriter(\"text.txt\");
write.write(str);
writer.close

;

如果用gb2312编译

你会找到e4bda0

字段；
如果用8859_1编译

00c400e3

2进制:
0000

0000

1100

0100

0000

1110

0011

每个

都大于7位

因此用11位编码:
1100

0001

1000

0100

1100

0011

1010

0011
c1--84--　c3--　a3
你会找到c184c3a3

但是我们往往忽略掉这个参数

因此这样往往会有跨平台

问题:
样例代码在中文平台上编译

生成zh

样例代码在英文平台上编译

输出en

(1).　zh

在中文平台上执行ok,但是在英文平台上不行
(2).en

在英文平台上执行ok,但是在中文平台上不行
原因:
(1).在中文平台上编译后

其实str在运行态

char

是0x4f60,　在中文平台上运行

filewriter

缺省编码是gb2312,因此charto

converter会自动用

gb2312

converter,把str转化成

输入到fileoutputstream中

于是0xc4,0xe3放进了文件

但是如果是在英文平台下

charto

converter

缺省值是8859_1,filewriter会自动

8859_1去转化str,但是他无法解释

因此他会输出\"?\"
(2).在英文平台上编译后

其实str在运行态

char

是0x00c40x00e3,在中文平台上运行

中文无法识别

因此会出现??；
在英文平台上

0x00c4-->0xc4,0x00e3->0xe3

因此0xc4,0xe3被放进了文件

6.其它原因:<%@pagecontentType=\"text/html;char

=GBK\"%>
设置浏览器

显示编码

如果response

数据是utf8编码

显示将是乱码

但是乱码和上述原因还不

样

7.发生编码地方:
从数据库到java

——〉char
从java

到数据库char——〉

从文件到java

——〉char
从java

到文件char——〉

从java

到页面显示char——〉

从页面form提交数据到java

——〉char
从流到java

——〉char
从java

到流char——〉

谢志钢

解决思路方法:
我是使用配置过滤器

思路方法解决中文乱码

:

<web-app>
<filter>
<filter-name>RequestFilter</filter-name>
<filter-

>net.golden.uirs.util.RequestFilter</filter-

>
<init-param>
<param-name>char

</param-name>
<param-value>gb2312</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>RequestFilter</filter-name>
<url-pattern>*.jsp</url-pattern>
</filter-mapping>
</web-app>

publicvoiddoFilter(ServletRequestreq,ServletResponseres,
FilterChainfChain)throwsIOException,ServletException{

HttpServletRequestrequest=(HttpServletRequest)req;
HttpServletResponseresponse=(HttpServletResponse)res;
HttpSessionsession=request.getSession

;
StringuserId=(String)session.getAttribute(\"userid\");
req.

CharacterEncoding(this.filterConfig.getInitParameter(\"char

\"));//设置

集？
实际上是设置了

——〉char

encoding
try{

(userId

null||userId.equals(\"\")){

(!request.getRequestURL

.toString

.matches(
\".*/uirs/logon/logon(Controller){0,1}\\\\x2Ejsp$\")){
session.invalidate

;
response.sendRedirect(request.getContextPath

+
\"/uirs/logon/logon.jsp\");
}
}

{//看看是否具有信息上报系统

权限

(!net.golden.uirs.util.UirsChecker.check(userId,\"信息上报系统\",
net.golden.uirs.util.UirsChecker.ACTION_DO)){

(!request.getRequestURL

.toString

.matches(
\".*/uirs/logon/logon(Controller){0,1}\\\\x2Ejsp$\")){
response.sendRedirect(request.getContextPath

+
\"/uirs/logon/logonController.jsp\");
}
}
}
}
catch(Exceptionex){
response.sendRedirect(request.getContextPath

+
\"/uirs/logon/logon.jsp\");
}
fChain.doFilter(req,res);
}

标签：游戏乱码怎么解决怎么解决乱码如何解决乱码解决乱码

下载文章的 PDF文档电子版离线看

我顶

专注于互联网--专注于架构

首页 »Java教程 » 解决乱码:这是我们公司总结的一些关于中文乱码问题的一些解决方案和经验和大家分享！ »正文

解决乱码:这是我们公司总结的一些关于中文乱码问题的一些解决方案和经验和大家分享！

相关文章

读者评论

发表评论

热门标签

精华推荐

最新标签

Dig排行

阅读排行

最新文章