汉字码的转换

汉字编码:国标码(交换码) 、输入码(外码)、机内码(内码)和

输出码(字模或显示码)

汉字在机内的存储和表示称为内码,

供汉字输入(主要是通过键盘进行输入)的编码称为外码,

供计算机输出(主要是指显示和打印)的编码称为汉字字模。

首先介绍汉字的内码,计算机处理汉字信息使用的编码。计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。在这其中又有几种编码形式。

1)汉字交换码

ASCII 码是针对英文的字母、数字和其他特殊字符进行编码的,它不能用于对汉字的编码。要想用计算机来处理汉字,就必须先对汉字进行适当的编码。这就是“汉字交换码”。我国在1981年5月对6 000多个常用的汉字制定了交换码的国家标准,即:GB 2312-80,又称为“国标码”。该标准规定了汉字交换用的基本汉字字符和一些图形字符,它们共计7 445个,其中汉字有6 763个。其中,一级汉字(常用字)3 755个,按汉字拼音字母顺序排列,二级汉字3 008个,按部首笔画次序排列。该标准给定每个字符的二进制数编码,即国标码。

2)区位码

它是将GB 2312-80的全部字符集组成一个94×94的方阵,每一行称为一个“区”的编码方式。在这种编码中的编号为0l ~94:每一列称为一个“位”,编号也为0l ~94,这样得到GB 2312-80标准中汉字的区位图。用区位图的位置来表示的汉字编码,称为区位码。

3)机内码

为了避免ASCII 码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。

4)汉字机内码、国标码和区位码3者之间的关系

汉字机内码、国标码和区位码3者之间的关系为:

区位码(十进制数)的两个字节分别转换为十六进制数后加20H 得到对应的国标码;

机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H 得到对应的机内码;

区位码(十进制数)的两个字节分别转换为十六进制数后加A0H 得到对应的机内码。

接下来介绍汉字输入码(外码)。

目前,汉字输入法主要有键盘输入、文字识别和语音识别。键盘输入法是当前汉字输入的主要方法。它大体可以分为:

流水码:如区位码、电报码、通信密码,优点是重码少,缺点是难于记忆; 音 码:以汉语拼音为基准输入汉字,优点是容易掌握,但重码率高; 形 码:根据汉字的字型进行编码,优点是重码少,但不容易掌握;

音形码:将音码和形码结合起来,能减少重码率,并提高汉字输入速度。

最后,简单向大家介绍汉字字模。

供计算机输出汉字(显示和打印)用的二进制数信息叫汉字字形信息也称字模。通用汉字字模点阵规格有:16×16,24×24,32×32,48×48,64×64。每个点在存储器中用一个二进制数存储,如一个16×16点阵汉字需要32个字节的存储空间。

区位码、国标码与机内码的转换关系方法:

(1)区位码先转换成十六进制数表示

(2)(区位码的十六进制表示)+2020H =国标码;

(3)国标码+8080H =机内码

举例:以汉字“大”为例,“大”字的区内码为2083

1、区号为20, 位号为83

2、将区位号2083转换为十六进制表示为1453H 3、1453H +2020H =3473H, 得到国标码3473H 4、3473H +8080H =B4F3H, 得到机内码为B4F3H

汉字编码:国标码(交换码) 、输入码(外码)、机内码(内码)和

输出码(字模或显示码)

汉字在机内的存储和表示称为内码,

供汉字输入(主要是通过键盘进行输入)的编码称为外码,

供计算机输出(主要是指显示和打印)的编码称为汉字字模。

首先介绍汉字的内码,计算机处理汉字信息使用的编码。计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。在这其中又有几种编码形式。

1)汉字交换码

ASCII 码是针对英文的字母、数字和其他特殊字符进行编码的,它不能用于对汉字的编码。要想用计算机来处理汉字,就必须先对汉字进行适当的编码。这就是“汉字交换码”。我国在1981年5月对6 000多个常用的汉字制定了交换码的国家标准,即:GB 2312-80,又称为“国标码”。该标准规定了汉字交换用的基本汉字字符和一些图形字符,它们共计7 445个,其中汉字有6 763个。其中,一级汉字(常用字)3 755个,按汉字拼音字母顺序排列,二级汉字3 008个,按部首笔画次序排列。该标准给定每个字符的二进制数编码,即国标码。

2)区位码

它是将GB 2312-80的全部字符集组成一个94×94的方阵,每一行称为一个“区”的编码方式。在这种编码中的编号为0l ~94:每一列称为一个“位”,编号也为0l ~94,这样得到GB 2312-80标准中汉字的区位图。用区位图的位置来表示的汉字编码,称为区位码。

3)机内码

为了避免ASCII 码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。

4)汉字机内码、国标码和区位码3者之间的关系

汉字机内码、国标码和区位码3者之间的关系为:

区位码(十进制数)的两个字节分别转换为十六进制数后加20H 得到对应的国标码;

机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H 得到对应的机内码;

区位码(十进制数)的两个字节分别转换为十六进制数后加A0H 得到对应的机内码。

接下来介绍汉字输入码(外码)。

目前,汉字输入法主要有键盘输入、文字识别和语音识别。键盘输入法是当前汉字输入的主要方法。它大体可以分为:

流水码:如区位码、电报码、通信密码,优点是重码少,缺点是难于记忆; 音 码:以汉语拼音为基准输入汉字,优点是容易掌握,但重码率高; 形 码:根据汉字的字型进行编码,优点是重码少,但不容易掌握;

音形码:将音码和形码结合起来,能减少重码率,并提高汉字输入速度。

最后,简单向大家介绍汉字字模。

供计算机输出汉字(显示和打印)用的二进制数信息叫汉字字形信息也称字模。通用汉字字模点阵规格有:16×16,24×24,32×32,48×48,64×64。每个点在存储器中用一个二进制数存储,如一个16×16点阵汉字需要32个字节的存储空间。

区位码、国标码与机内码的转换关系方法:

(1)区位码先转换成十六进制数表示

(2)(区位码的十六进制表示)+2020H =国标码;

(3)国标码+8080H =机内码

举例:以汉字“大”为例,“大”字的区内码为2083

1、区号为20, 位号为83

2、将区位号2083转换为十六进制表示为1453H 3、1453H +2020H =3473H, 得到国标码3473H 4、3473H +8080H =B4F3H, 得到机内码为B4F3H


相关文章

  • 几种典型汉字编码之间转换的原理与实现
  • 计算机科学2008Voi.35NQ.4B 几种典型汉字编码之间转换的原理与实现 周 (西南石油大学计算机科学学院 成都610500)1 永1 陈宁2 成都610213)2 (中国石油西南油气田公司输气管理处 摘要本文讨论汉字与机内码.区位码 ...查看


  • 汉字代码转换办法简述
  • 一.前言 汉字库中某一类汉字不是所有已汉化软件系统都能支持的,即使支持也不是全部输入法都能够输入,而这类汉字在地名和人名中经常见到,例如:西安浐河区.镕.詠等,如果涉及到多个代码集之间的 转换,则让系统设计者和系统用户颇感困惑. 笔者通过检 ...查看


  • 如何将汉字转换成二进制编码
  • 各数制之间的转换 我们用R表示任何数制的基数,讨论各数制之间的转换. 1.R进制数转换为十进制数 二进制.八进制和十六进制数转换为等值的十进制数,只要把它们用多项式表示并在十进制下进行计算,所得的结果就是十进制数. 2.十进制数转换为R进制 ...查看


  • 首因效应向近因效应转换的实验研究
  • b理科学2002年第25卷第6期 首因效应向近因效应转换的实验研究 剖爱伦周丽华 (浙江大学心理与行为科学系,杭州.31097.g) 摘要实验1以汉字与英文字母为材料,考察了自由回忆中学习与测验之间不同时间问隔(0s与10s)条件下的成绩, ...查看


  • 汉字编码关系
  • 输入码.区位码.国标码与机内码 我们知道,键盘是当前微机的主要输入设备,输入码就是使用英文键盘输入汉字时的编码.目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码.音码.形码.音形码四类, ...查看


  • 信息技术与计算机文化
  • 第一章 信息技术与计算机文化 1.1 信息与信息技术 1.1.1 信息与数据 所谓数据,是指存储在某种媒体上可以加以鉴别的符号资料.这里所说的符号,不仅指文字.字母.数字,还包括了图形.图像.音频与视频等多媒体数据.由于描述事物的属性必须借 ...查看


  • 乱码出现的问题大全
  • 乱码出现的问题大全.txt 我们在使用电脑时,经常会遇到乱码:例如登上港台网站时会看到乱码,打开E-mail时也会看到乱码,更为严重的是原先显示正常的Win9X/Win2K桌面.菜单中汉字一夜之间"面目全非",本来显示正 ...查看


  • 重庆市职称计算机考试模拟题
  • 重庆市2009年职称计算机考试笔试模拟试题(一) (1)世界上第一台计算机的名称是 A (A )ENIAC (B )APPLE (C )UNIV AC-I (D )IBM-7000 [解析]A 世界上第一台计算机名字叫Electronic ...查看


  • 第二讲 信息的数字化
  • 第二讲 信息的数字化 一. 教学目标: 1) 知识与技能: 知道ASCII 码 知道汉字在计算机里是如何表示的 理解声音和图象的数字化 理解信息是如何压缩的 2)过程与方法:通过自学微视频完成任务单,在教师引导下通过自学掌握知识. 3)情感 ...查看


热门内容