java编程思想:Java编程技术中汉字问题的分析...

来源: 发布时间:星期三, 2008年12月3日浏览:18次评论:0

汉字编码的常识

　　我们知道，英文字符一般是以一个字节来表示的，最常用的编码方法是 ASCII 。但一个字节最多只能区分256个字符，而汉字成千上万，所以现在都以双字节来表示汉字，为了能够与英文字符分开，每个字节的最高位一定为1，这样双字节最多可以表示64K格字符。我们经常碰到的编码方式有 GB2312、BIG5、UNICODE 等。关于具体编码方式的详细资料，有兴趣的读者可以查阅相关资料。我肤浅谈一下和我们关系密切的 GB2312 和 UNICODE。GB2312 码，中华人民共和国国家标准汉字信息交换用编码，是一个由中华人民共和国国家标准总局发布的关于简化汉字的编码，通行于中国大陆地区及新加坡，简称国标码。两个字节中，第一个字节（高字节）的值为区号值加32（20H），第二个字节（低字节）的值为位号值加32（20H），用这两个值来表示一个汉字的编码。UNICODE 码是微软提出的解决多国字符问题的多字节等长编码，它对英文字符采取前面加“0”字节的策略实现等长兼容。如 “A” 的 ASCII 码为0x41，UNICODE 就为0x00，0x41。利用特殊的工具各种编码之间可以互相转换。

　　Java 中文问题的初步认识

　　我们基于 Java 编程语言进行应用开发时，不可避免地要处理中文。Java 编程语言默认的编码方式是 UNICODE，而我们通常使用的数据库及文件都是基于 GB2312 编码的，我们经常碰到这样的情况：浏览基于 JSP 技术的网站看到的是乱码，文件打开后看到的也是乱码，被 Java 修改过的数据库的内容在别的场合应用时无法继续正确地提供信息。
String sEnglish = “apple”;

String sChinese = “苹果”;

String s = “苹果 apple ”;
sEnglish 的长度是5，sChinese的长度是4，而 s 默认的长度是14。对于 sEnglish来说， Java 中的各个类都支持得非常好，肯定能够正确显示。但对于 sChinese 和 s 来说，虽然 Java Soft 声明 Java 的基本类已经考虑到对多国字符的支持（默认 UNICODE 编码），但是如果操作系统的默认编码不是 UNICODE ，而是国标码等。从 Java 源代码到得到正确的结果，要经过 “Java 源代码-> Java 字节码-> ;虚拟机->操作系统->显示设备”的过程。在上述过程中的每一步骤，我们都必须正确地处理汉字的编码，才能够使最终的显示结果正确。

　　“ Java 源代码-> Java 字节码”，标准的 Java 编译器 javac 使用的字符集是系统默认的字符集，比如在中文 Windows 操作系统上就是 GBK ,而在 Linux 操作系统上就是ISO-8859-1，所以大家会发现在 Linux 操作系统上编译的类中源文件中的中文字符都出了问题，解决的办法就是在编译的时候添加 encoding 参数，这样才能够与平台无关。用法是

　　javac ?Cencoding GBK。

　　“ Java 字节码->虚拟机->操作系统”， Java 运行环境（JRE）分英文版和国际版，但只有国际版才支持非英文字符。 Java 开发工具包（JDK）肯定支持多国字符，但并非所有的计算机用户都安装了 JDK 。很多操作系统及应用软件为了能够更好的支持 Java ，都内嵌了 JRE 的国际版本，为自己支持多国字符提供了方便。

如果本文没有解决您的问题，请进老妖怪开发者社区提问

标签：java编程工具 java编程软件 java编程 java编程思想

下载文章的 PDF文档电子版离线看

顶一下

2008-10-20 2:41:08 java编程思想:浅出Java 的Xml编程
2008-11-27 3:17:26 mac编程:用纯JAVA语言编程读取MAC地址的实现
2008-10-20 2:51:57 java编程思想:JAVA编程思想1
2008-9-10 15:24:50 java编程:Java 编程技术中汉字问题的分析及解决
2008-10-30 22:28:24 java编程思想:JAVA WEB编程中的SQL知识
2008-9-25 0:51:42 编程学习:ILE 下c/c++/cl/RPG等混合编程
2008-9-10 15:52:37 java编程:Java 编程技术中汉字问题的分析及解决
2008-9-4 22:46:14 j2ee编程: J2EE综合--总结在java编程中的经验教训
2008-9-10 15:51:30 java组件:java语言面向组件编程（一）导言
2008-9-10 15:25:05 java编程:JAVA编程中异常问题处理方式的区别和分析

读者评论

共0条分0页

专注于互联网--专注于架构

首页 »Java教程 » java编程思想:Java编程技术中汉字问题的分析... »正文

java编程思想:Java编程技术中汉字问题的分析...

相关文章

读者评论

发表评论

热门标签

精华推荐

Dig排行

阅读排行

评论排行