请问网: 全码输入法
全码--全码学习--高级教程--编码规则  

 
4、编码规则

 

1、三键码
全码是一种三键码,不考虑简码的话,每个汉字对应的编码应该为三个拉丁字母(英文字母)。
全码使用了25个拉丁字母,其理论编码容量(假设一字一码)为25×25×25,即15625个,相对于1981年5月我国公布的《国家标准“GB2312-80信息交换用汉字编码字符集(基本集)》中的6763个汉字,容量已经足够。


2、字母
全码使用除字母“V”以外的25个拉丁字母为编码字母,以字母“V”为编码中的通配符,该字母对应的键作为万能键。由于一些字母在汉语拼音中作韵母使用,很少成为汉语拼音在的第一个字母,又考虑到汉语拼音的一些特殊发音,故在全码编码中对部分字母针对汉语拼音作出了一些调整。
汉字的汉语拼音是yu开头的,用字母U代替,例如“雨”(yu)、“云”(yun)、“月”(yue)、“元”(yuan)等字;
汉字的汉语拼音是以yi开头的,用字母I代替,例如“一”(yi)、“衣”(yi)等字;
汉字的汉语拼音是以o、yo、you开头的,用字母O代替,例如“噢”(o)、“唷”(yo)、“有”(you)、“又”(you)等字。
其余22个字母可视为汉语拼音字母般在编码中正常使用。
这样安排既不违反汉语拼音的规则,又可将字母在编码中尽量均匀地分配,从而减少重码。


3、笔画对应的字母
笔画按常规的方法来划分,有“五笔”、“六笔”和“七笔”等,全码中采用最常见的五笔划分:一丨丿ㄟ乙(横竖撇捺折)。
五种笔画所对应的拼音字母为H(横heng)、S(竖shu)、P(撇pie)、N(捺na)、Z(折zhe)。


4、字元字对应的字母
字元字共有249个,它们既是构成汉字的常用构件,本身又是完整的汉字,因此有着固有的汉语拼音,如“白”(bai)、“无”(wu)、“子”(zi)、“止”(zhi)等等。字元字对应的拉丁字母来自于该字本身的汉语拼音,无须记忆。

 

5、字元对应的字母
字元有71个,大多数是一些偏旁部首,如“亻”、“灬”等等;
还有少数几个是作出特殊读音规定的简单汉字和部首,如“主”(定为“敖”字音ao)、“廿”(定为“艹”部首音cao)等等;
其余的是一些常见的不太规则的汉字构件。
字元对应的字母,来自于对其读音的规定,这种规定有三种:


A、规范读音:字元是标准的偏旁部首,本来有着的习惯读音。
例如:“亻”,习惯叫“单人旁”,规定其汉语拼音为“ren”,故对应字母为R;“氵”,习惯叫“三点水”,规定其汉语拼音为“shui”,故对应字母为S;
“阝”,习惯叫“耳旁”,规定其汉语拼音为“er”,故对应的字母为E;
“艹”,习惯叫“草字头”,规定其汉语拼音为“cao”,故其对应的字母为C。
这些规范读音,一看就会,基本上无需刻意学习便可记熟。


B、构字读音:以该字元构成的某常见字的拼音作为其读音。
例如:“宀”是常见字“安”字的构件,将其汉语拼音音定为“an”,故该字元对应的字母为A;
“虍”是常见字“虎”的构件,将其汉语拼音定为“hu”,故其对应的字母为H;
“廴”是常见字“建”的构件,将其汉语拼音定为“jian”,故其对应的字母为J。


C、相形读音:该字元与某汉字和某字元形状相似,以其相似的字或字元的读音为该字元的读音。
例如:“冂”与“几”相似,将其汉语拼音定为“ji”,故其对应的字母为J;
“凵”与“凹”相似,将其汉语拼音定为“ao”,故其对应的字母为A;
“扌”与“牛”相似,将其汉语拼音定为“niu”,故其对应的字母为N。


根据以上三种方法对71个字元的对应字母加以规定。
实际上,真正需要用心去记的是一些相形读音规则下的字元,这在71个字元中仅占四分之一左右,因而记忆量并不大。
“一”(yi)字与笔画“一”(横heng)在形状上是一样的,因此要特别说明。只有在字元字中,“一”才是笔画“横”,对应字母为H;其它情况下,均为数字“一”,对应字母为I。
有关字元字和字元的对应字母,详见《全码输入法字元表》

 

6、字元字的拆分
字元字是一些无法用正常规律拆分的独体汉字,如“五”、“日”、“之”、“口”等等,因此采用笔画来拆分。
字元字的首部,是书写该字的首笔笔画,尾部当然是书写该字的最后一笔。


7、非字元字的拆分
非字元字的拆分,应按照汉字结构的固有规律进行。
汉字的结构有独体形(如“人”)、左右形(如“红”)、上下形(如“全”)、包围形(如“连”、“国”)和混合形(如“梁”、“混”)五种,要拆分汉字的首尾部,必须了解这几种汉字结构。
由于每个人的汉字书写习惯不同,笔顺不尽相同,首尾笔因人而异,这就需要有明确的规定。
不过,从小学开始,我们便学习过汉字的书写次序,即标准笔顺原则,全码对汉字的拆分也是按照这种标准笔顺规则而进行。 这种规则就是:先左后右,先上后下,先外后内,先中后旁。
例如:
“红”字的拆分,先左后右,首部为“纟”,尾部为“工”;
“全”字的拆分,先上后下,首部为“人”,尾部为“王”;
“连”字的拆分,先外后内,首部为“之”,尾部为“车”;
“国”字的拆分,先外后内,首部为“口”,尾部为“玉”;
“乘”字的拆分,先中后旁,首部为“禾”,尾部为“匕”; 混合形字“梁”字的拆分,以上下形为主,故先上后下,上面部分又是左右形结构,故先左后右,首部为“氵”,尾部为“木”;
混合形字“混”字,以左右形为主,故先左后右,右边又是上下形,故先上后下,首部为“氵”,尾部为“匕”。
由此可见,首部是汉字首笔所在的部分,尾部是除开首部后的尾笔所在部分,应该注意的是,非字元字的尾部并不一定是汉字尾笔所在的部分。
我们再看一看: 例如“威”字,第一笔是“戊”部分的“一”,最后一笔是“戊”部分的“丶”,但“戊”已经作为该汉字的首部,所以,该汉字的尾部是除开“戊”部分后的最后一笔(“女”部分的“一”)所在部分,所以尾部是“女”;
再如“国”字,第一笔是“口”部分的“丨”最后一笔是“口”部分的“一”,“口”是该汉字的首部,故其尾部是“玉”。

 

8、词组
全码输入法最高容码为六键。二字词组的编码由二字全码合成,如“全码”一词,编码为QRW(全)MSM(码),“词组”的编码为CYK(词)ZYQ(组); 三字词组的编码由首字的全码,加上二字、三字的字码,加上三字的尾码组成,如“计算机”的编码为JYS(计)S(算)JJ(机),“房地产”的编码为FHF(房)D(地)CP(产),“所有权”的编码为SCJ(所)O(有)QO(权); 三字以上词组的编码由首字的全码,加上二字三字的字码,加上尾字的字码组成,如“汉字系统”的编码为HSO(汉)Z(字)X(系)T(统),“马达加斯加”的编码为MZH(马)D(达)J(加)J(加)。

 

9、通配符(万能键)V
在全码中,特意安排了一个万能键V,可作为汉字输入的特殊辅助键,放在字码的位置,即第一个码。比方说,可输入VAA、VAB、VAC。
例如:“爱”,若是不清楚其字码,可以用V代替字码,输入VAO,提示栏上则会出现“1爱2变3就4寂5寇……”,键入数字键1或空格键,即可输入汉字“爱”。
万能键最适合于 输入不认识的字,或是知道其意但读不出准确发音的字。对以音为主的输入法来说,除非加入部首输入之类的形输入模板块,否则无法输入不知道读音的字。全码的万能键解决了这个难题。
在DOS版本的全码中,万能键可以放在编码的任何位置,功能更强。由于Windows的设置原因,在Windows下,全码的V只能作为 字码万能键,其实这样就足够了,因为全码的字元,小学三年级以上文化就知道其音,可以输入首码和尾码。

 

10、重码处理
作为一种三键码,其重码率的理论数字当然要比四键码高,因此,尽可能地减少重码,是全码的编码过程中的重要考虑因素。 全码通过对字元和字元字汉语拼音的合理规定来减少重码。
由于汉语拼音的特殊性,字母在汉字中的使用并不均匀,尤其是汉语拼音的第一个字母,有的字母仅作为韵母使用,很少成为第一个字母。
譬如字母V在汉语拼音中并不存在,而字母U用于汉语拼音开头时,前面必须加W。
因此,全码将汉语拼音o、yo、you归入字母O,将汉语拼音yi归入字母I,将汉语拼音yu归入字母U,都是鉴于汉语拼音字母非均匀使用的特点而作出的安排。
根据全码的注音规则,将部分字元作了一定调整。例如字元“扌”,本来习惯上叫作“提手旁”,但全码中并没有将其归入字母S的范畴,而是因其与汉字“牛”相似,因而将之列入字母N下面;另如字元“饣”,习惯上叫作“食旁”,全码因其与汉字“个”相似而列入字母G下。
根据汉字的相似特点,将少数简单的独体字归入一个音中,视为字元而非字元字。例如将汉字“壬”归入“王”,拼音代码定为W;将“士”归入“土”,拼音代码定为T;“夭”归入“天”,拼音代码定为T;“千”、“干”归入“于”,拼音代码定为U。
这样,不仅有利于减少重码,也能够解决手写体与印刷体的差异(譬如很多人在手写中“夭”与“天”分得并不清楚),即使习惯了不符合印刷标准的手写方法,在全码的学习和使用中毫无影响。

   
 

关于本站 | 联系我们
请问网
QWask.Com© 1993 - 2013
粤ICP备08123371号
安网4419003012394号
法律顾问:周舟 高级律师


(建议使用1024X768以上分辨率浏览本站)