专注于互联网--专注于架构

最新标签
网站地图
文章索引
Rss订阅

首页 »Javascript教程 » utf8gb2312:用javascript实现gb2312转utf-8的脚本 »正文

utf8gb2312:用javascript实现gb2312转utf-8的脚本

来源: 发布时间:星期六, 2008年12月27日 浏览:177次 评论:0
信息交换用汉字编码集-基本集
汉字标准交换码共分两级级为常用字有3755字按汉语拼音字母顺序排列第 2级为次常用字有3008字按部首排列GB2312编码范围为2121H-777EH.
UNICODE 是两字节全编码对于ASCII它也使用两字节表示代码页是通过高字节取值范围来确定是ASCII还是汉字高字节如果发生数据损坏 某处内容破坏则会引起其后汉字混乱UNICODE则律使用两个字节表示最明显好处是它简化了汉字处理过程
有关编码文章可以参考:
http://blog.iyi.cn/tech/2005/10/unicode_2.html
http://blog.iyi.cn/tech/2005/10/unicode.html
百度页面是gb2312URL编码自然也是从gb转换而来比如“”这个字百度转换结果是D2%BB而从Utf-8转换来结果是%E4%B8%80比如google(gb是2字节编码utf-8是3字节变长编码)
可以用javascriptencodeURI和decodeURI来得到这些结果设置页面编码就可以看到区别结果了
在网上找也没找到现成转换只得自己写还好网上不缺gb-utf对照表修改了下就可以用了:gb-utf.txt
这个对照表是将gb字节编码转到utf16进制编码而不是字节编码
javascript中escape和unescape是转换16进制编码用因此gb汉字到utf汉字转换思路是:encodeURI("gb汉字")到对照表中查找utf16进制编码unescape("16进制utf编码")得到utf汉字
中间那步最关键转换只用到了这其他两步直接那两个就可以了下面是转换:
[[Ctrl+A 全选 提示:你可先修改部分代码,再按运行]

0

相关文章

读者评论

发表评论

  • 昵称:
  • 内容: