中国汉字将来的输入 我国是文明古国,中华文化源远流长,影响深远,特别是汉字对推动我国社会的进步和发展起到了不可磨灭的作用。随着计算机技术的应用和发展,将来大家都会投入到这个奇妙的世界里。中国人在学习和使用计算机的同时,却不得不多学一样枯燥而又十分重要的技能,这就是中国汉字的输入。想要让每个中国人都能在这个奇妙的世界里“输”得到轻轻松松、痛痛快快,我们还必须要找一种好的输入法。
从电子计算机迈入中国大门的那一天起,中国无数的计算机专家、学者在为了汉字在计算机上能让大家“输”得轻轻松松、痛痛快快,做过大量的输入方法工作。时至今天,有称百花齐放的汉字输入法,无论是传统的键盘输入,还是科技含量和难度较高的手写输入、语音输入及OCR扫描输入都已经发展到一个比较成熟的阶段。但要让大家真的“输”得轻轻松松、痛痛快快,却找不着。还能,要像外国的社交工具(英语)能在计算机上推动他们的社会经济普遍的应用发展,我国的社交工具(汉字)在计算机上的输入发展,还做了远远不够。
说起汉字输入,键盘输入汉字是我们日常生活中使用得最多、普及性最广的一种输入方式,还是得从键盘输入说起。我们知道,西文字符不超过128个,在电脑中采用1个字节(8位)可以完成所有西文字符的编码,ASCII码规定,西文字符的编码只使用字节的第1位到第7位,最高位为“0”,这样使用7位二进制可编码的西文字符数最大可达2的7次方即128个,完全可以满足所有西文字符的编码需要。
汉字的个数比起西文字符来讲那就多得多了,我们使用的汉字大约有6万多个,即使是国家规定的最常用和较常用的汉字也有6000多个,所以国家标准规定每个汉字编码采用两个字节(16位)表示,并尽可能与西文的ASCII码一致,也就是说,汉字国标码的两个字节中每个字节也只使用字节的第1位到第7位,最高位为“0”。但这样一来,由于汉字国标码与西文字符的ASCII码每一个字节的最高位都为“0”,二者互相冲突,也就是说,如果内存中有两个字节,到底这两个字节表示的是一个汉字还是两个西文字符呢,这二者都有可能,计算机很容易造成混淆。所以汉字的国标码是不能在计算机内直接使用的,必须加以改变,改变的方法也很简单,也就是把汉字国标码两个字节中的每一个字节都加上128,相当于把该字节的最高位(第8位)的“0”换成“1”,其余7位保留原有的数字不变,这种经过变换过的国标码就是计算机内部实际采用的汉字的机内码。由于西文字符的ASCII码都小于128,而汉字机内码的每一个字节都大于128,所以电脑就可以把汉字的机内码与西文字符采用的ASCII码区分开识别了。
现在我们可以知道汉字的输入其实就是汉字机内码的输入、识别和转换成汉字的过程。但输入汉字的机内码对普通电脑操作者而言几乎是不可能的,因为机内码的输入有难于记忆、输入速度慢、容易出错等致命缺陷,所以经过中国无数的计算机专家、学者的不断探索,研究出了许多比较实用的编码,对于普通用户而言只要输入这些简单编码,电脑就可以通过这些输入法软件自动完成由汉字编码转换成汉字机内码,再由汉字机内码转换成汉字的全过程,这些编码就是汉字编码。目前,我们国内有数百种之多的汉字输入法,拥有广大用户群的汉字输入法也有几十种之多,尽管它们采用不同的汉字编码原理,但归纳起来可分为以下4大类: |