专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅

首页 »Java教程 » gb2312编码:GB 2312 汉字编码字符集 »正文

gb2312编码:GB 2312 汉字编码字符集

来源: 发布时间:星期四, 2009年2月12日 浏览:161次 评论:0
GB 2312 码是中华人民共和国国家标准汉字信息交换用编码全称信息交换用汉字编码集 基本集标准号为 GB 2312-80(GB 是“国标” 2字 汉语拼音缩写)由中华人民共和国国家标准总局发布1981年5月1日实施习惯上称国标码、GB 码或区位码它是个简化字汉字编码通行于中国大陆地区新加坡等地也使用这编码  JAVA中文站社区门户"a1a F NnK-@
      GB 2312-80 收录简化汉字及般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母共 7445 个图形其中汉字以外图形 682 个汉字 6763 个  
`j"zl9Lp      GB 2312-80 规定“对任意个图形都采用两个字节(Byte)表示每个字节均采用 GB 1988-80 及 GB 2311-80 中 7位编码表示两个字节中前面字节为第字节后面字节为第 2字节”习惯上称第字节为“高字节”第 2字节为“低字节”  JAVA中文站社区门户R)j]![&LY8U
      GB 2312-80 将代码表分为 94 个区(Section)对应第字节;每个区94 个位(Position)对应第 2字节两个字节分别为区号值和位号值各加 32(20H)  JAVA中文站社区门户h~NpK$c5l
      GB 2312-80 规定01~09 区(原规定为 1~9 区为表示区位码方便起见今改称 01~09 区)为符号、数字区16~87 区为汉字区而 10~15区、88~94 区是有待于“进步标准化”“空白位置”区域但第 10 区推荐和第 3 区 94 个图形(即 GB 1988-80 中 94 个图形)相同  
3w;tD&}e0~P1A l  字形宽度为其宽度  
t,vst2^F?4~ O      GB 2312-80 把收录汉字分成两级级汉字是常用汉字计 3755 个置于 16~55 区按汉语拼音字母/笔形顺序排列;第 2级汉字是次常用汉字计 3008 个置于 56~87 区按部首/笔画顺序排列字音以普通话审音委员会发表普通话异读词 3次审音总表初稿(1963年出版)为准字形以中华人民共和国文化部、中国文字改革委员会公布印刷通用汉字字形表(1964年出版)为准  JAVA中文站社区门户K"Q.M6S,^J#D(iqy:@7k:{

d7mE1FV/~8~ J3w      例:汉字“啊”字节为 0110000第 2字节为 0100001即 16 区、01 位用 16-01 表示  JAVA中文站社区门户h n D.h7_n-OF

9hQoR8jf*z
chQ kWy._6|;kh/j O }      注:  JAVA中文站社区门户 DKI9x i&F#p"e3F$@0vy
      1. 有些外挂式中文平台不能正确显示 01~15 区空白位置  
qv wI5n z4Z#K7]      2. 02 区 0201~0210、06 区 0664~0685 和 08 区 0827~0832 位置在 GB 2312-80 中原本规定为有待于进步标准化空白位置但如果你使用操作系统为 Windows 95 简体中文版(及更高版本)或者使用了其他支持 GBK 码、CJK 码汉字系统在某些情况下会看到以上位置分别为 10 个小写罗马数字、19 个中文竖排用符号和 6 个汉语拼音符号这些符号系 GB  5007.1、GB/T 12345-90 及 GBK 增补符号由于 Windows 95 简体中文版使用了 GBK 字体所以显示出这些符号此外第 10、11、12 区显示汉字也属类似情况  JAVA中文站社区门户%I8zA(IpI+a*~2hT8N0p
      3. GB 码编码范围为 2121H~777EH和 ASCII 码有重叠通行将 GB 码两个字节最高位均置 1(MSB=1)以示区别因此实际应用 GB 码是 GB  码高位置 1 后变形码编码范围为 0A1A1H~0F7FEH如汉字“啊”字节为 10110000第 2字节为 10100001
JAVA中文站社区门户$yt!~]i 

ux9M*sE5cG

TAG: 集 汉字编码
0

相关文章

读者评论

发表评论

  • 昵称:
  • 内容: