第一类:拼音文字数字化
在拼音文字中,每个单词的字母构成都不相同。可是,当它们被数字化后,就会出现许多相同的数码。这是因为,几十个字母分布在十个数字上,每个数字要承载好几个字母。这样一来,单词与数码之间的对应关系就不存在唯一性了。
为了减少重码现象,拼音文字的字母在数字上的分布,除了保持其自然顺序、便于记忆外,要尽可能地均匀。
我们采取了两种方式,使拼音文字数码具有了唯一性:
一是采用简码,即只取单词的前几个数码。绝大部分单词都取简码时,使拼音文字数码变短,还有利于提高拼音文字的处理效率。
二是采用补码,即增加或者补充一些数码。只是针对那些构成字母少的单词。通常是增加或者补充最后那个数码。
第二类:汉字数字化
1、设计汉字字母体系
为避免与汉语拼音字母相混淆,我们使用了汉字笔形来代替汉字字母。
第一,汉字笔形不能只包括汉字笔画
五种汉字笔画对应五个数字,另外五个数字闲置不用,本来就十分稀缺的数字资源,竟有一半被白白浪费掉了。这样的方案设计很难说是科学的、合理的
联系客服