全码输入法官方网站

	全码--全码学习--高级教程--编码规则


	4、编码规则　１、三键码全码是一种三键码，不考虑简码的话，每个汉字对应的编码应该为三个拉丁字母（英文字母）。全码使用了２５个拉丁字母，其理论编码容量（假设一字一码）为２５×２５×２５，即１５６２５个，相对于１９８１年5月我国公布的《国家标准“ＧＢ２３１２－８０信息交换用汉字编码字符集（基本集）》中的６７６３个汉字，容量已经足够。２、字母全码使用除字母“Ｖ”以外的２５个拉丁字母为编码字母，以字母“Ｖ”为编码中的通配符，该字母对应的键作为万能键。由于一些字母在汉语拼音中作韵母使用，很少成为汉语拼音在的第一个字母，又考虑到汉语拼音的一些特殊发音，故在全码编码中对部分字母针对汉语拼音作出了一些调整。汉字的汉语拼音是yu开头的，用字母Ｕ代替，例如“雨”（yu）、“云”（yun）、“月”（yue）、“元”（yuan）等字；汉字的汉语拼音是以yi开头的，用字母Ｉ代替，例如“一”（yi）、“衣”（yi）等字；汉字的汉语拼音是以o、yo、you开头的，用字母Ｏ代替，例如“噢”（o）、“唷”（yo）、“有”（you）、“又”（you）等字。其余２２个字母可视为汉语拼音字母般在编码中正常使用。这样安排既不违反汉语拼音的规则，又可将字母在编码中尽量均匀地分配，从而减少重码。３、笔画对应的字母笔画按常规的方法来划分，有“五笔”、“六笔”和“七笔”等，全码中采用最常见的五笔划分：一丨丿ㄟ乙（横竖撇捺折）。五种笔画所对应的拼音字母为Ｈ（横heng）、Ｓ（竖shu）、Ｐ（撇pie）、Ｎ（捺na）、Ｚ（折zhe）。４、字元字对应的字母字元字共有２４９个，它们既是构成汉字的常用构件，本身又是完整的汉字，因此有着固有的汉语拼音，如“白”（bai）、“无”（wu）、“子”（zi）、“止”（zhi）等等。字元字对应的拉丁字母来自于该字本身的汉语拼音，无须记忆。　５、字元对应的字母字元有７１个，大多数是一些偏旁部首，如“亻”、“灬”等等；还有少数几个是作出特殊读音规定的简单汉字和部首，如“主”（定为“敖”字音ao）、“廿”（定为“艹”部首音cao）等等；其余的是一些常见的不太规则的汉字构件。字元对应的字母，来自于对其读音的规定，这种规定有三种：Ａ、规范读音：字元是标准的偏旁部首，本来有着的习惯读音。例如：“亻”，习惯叫“单人旁”，规定其汉语拼音为“ren”，故对应字母为Ｒ；“氵”，习惯叫“三点水”，规定其汉语拼音为“shui”，故对应字母为Ｓ； “阝”，习惯叫“耳旁”，规定其汉语拼音为“er”，故对应的字母为Ｅ； “艹”，习惯叫“草字头”，规定其汉语拼音为“cao”，故其对应的字母为Ｃ。这些规范读音，一看就会，基本上无需刻意学习便可记熟。Ｂ、构字读音：以该字元构成的某常见字的拼音作为其读音。例如：“宀”是常见字“安”字的构件，将其汉语拼音音定为“an”，故该字元对应的字母为Ａ； “虍”是常见字“虎”的构件，将其汉语拼音定为“hu”，故其对应的字母为Ｈ； “廴”是常见字“建”的构件，将其汉语拼音定为“jian”，故其对应的字母为Ｊ。Ｃ、相形读音：该字元与某汉字和某字元形状相似，以其相似的字或字元的读音为该字元的读音。例如：“冂”与“几”相似，将其汉语拼音定为“ji”，故其对应的字母为Ｊ； “凵”与“凹”相似，将其汉语拼音定为“ao”，故其对应的字母为Ａ； “扌”与“牛”相似，将其汉语拼音定为“niu”，故其对应的字母为Ｎ。根据以上三种方法对７１个字元的对应字母加以规定。实际上，真正需要用心去记的是一些相形读音规则下的字元，这在７１个字元中仅占四分之一左右，因而记忆量并不大。 “一”（yi）字与笔画“一”（横heng）在形状上是一样的，因此要特别说明。只有在字元字中，“一”才是笔画“横”，对应字母为Ｈ；其它情况下，均为数字“一”，对应字母为Ｉ。有关字元字和字元的对应字母，详见《全码输入法字元表》。　６、字元字的拆分字元字是一些无法用正常规律拆分的独体汉字，如“五”、“日”、“之”、“口”等等，因此采用笔画来拆分。字元字的首部，是书写该字的首笔笔画，尾部当然是书写该字的最后一笔。７、非字元字的拆分非字元字的拆分，应按照汉字结构的固有规律进行。汉字的结构有独体形（如“人”）、左右形（如“红”）、上下形（如“全”）、包围形（如“连”、“国”）和混合形（如“梁”、“混”）五种，要拆分汉字的首尾部，必须了解这几种汉字结构。由于每个人的汉字书写习惯不同，笔顺不尽相同，首尾笔因人而异，这就需要有明确的规定。不过，从小学开始，我们便学习过汉字的书写次序，即标准笔顺原则，全码对汉字的拆分也是按照这种标准笔顺规则而进行。这种规则就是：先左后右，先上后下，先外后内，先中后旁。例如： “红”字的拆分，先左后右，首部为“纟”，尾部为“工”； “全”字的拆分，先上后下，首部为“人”，尾部为“王”； “连”字的拆分，先外后内，首部为“之”，尾部为“车”； “国”字的拆分，先外后内，首部为“口”，尾部为“玉”； “乘”字的拆分，先中后旁，首部为“禾”，尾部为“匕”；混合形字“梁”字的拆分，以上下形为主，故先上后下，上面部分又是左右形结构，故先左后右，首部为“氵”，尾部为“木”；混合形字“混”字，以左右形为主，故先左后右，右边又是上下形，故先上后下，首部为“氵”，尾部为“匕”。由此可见，首部是汉字首笔所在的部分，尾部是除开首部后的尾笔所在部分，应该注意的是，非字元字的尾部并不一定是汉字尾笔所在的部分。我们再看一看：例如“威”字，第一笔是“戊”部分的“一”，最后一笔是“戊”部分的“丶”，但“戊”已经作为该汉字的首部，所以，该汉字的尾部是除开“戊”部分后的最后一笔（“女”部分的“一”）所在部分，所以尾部是“女”；再如“国”字，第一笔是“口”部分的“丨”最后一笔是“口”部分的“一”，“口”是该汉字的首部，故其尾部是“玉”。　８、词组全码输入法最高容码为六键。二字词组的编码由二字全码合成，如“全码”一词，编码为QRW（全）MSM（码），“词组”的编码为CYK（词）ZYQ（组）；三字词组的编码由首字的全码，加上二字、三字的字码，加上三字的尾码组成，如“计算机”的编码为JYS（计）S（算）JJ（机），“房地产”的编码为FHF（房）D（地）CP（产），“所有权”的编码为SCJ（所）O（有）QO（权）；三字以上词组的编码由首字的全码，加上二字三字的字码，加上尾字的字码组成，如“汉字系统”的编码为HSO（汉）Z（字）X（系）T（统），“马达加斯加”的编码为MZH（马）D（达）J（加）J（加）。　９、通配符（万能键）Ｖ在全码中，特意安排了一个万能键Ｖ，可作为汉字输入的特殊辅助键，放在字码的位置，即第一个码。比方说，可输入ＶＡＡ、ＶＡB、VＡC。例如：“爱”，若是不清楚其字码，可以用Ｖ代替字码，输入ＶAＯ，提示栏上则会出现“１爱２变３就４寂５寇……”，键入数字键１或空格键，即可输入汉字“爱”。万能键最适合于输入不认识的字，或是知道其意但读不出准确发音的字。对以音为主的输入法来说，除非加入部首输入之类的形输入模板块，否则无法输入不知道读音的字。全码的万能键解决了这个难题。在DOS版本的全码中，万能键可以放在编码的任何位置，功能更强。由于Windows的设置原因，在Windows下，全码的V只能作为字码万能键，其实这样就足够了，因为全码的字元，小学三年级以上文化就知道其音，可以输入首码和尾码。　１０、重码处理作为一种三键码，其重码率的理论数字当然要比四键码高，因此，尽可能地减少重码，是全码的编码过程中的重要考虑因素。全码通过对字元和字元字汉语拼音的合理规定来减少重码。由于汉语拼音的特殊性，字母在汉字中的使用并不均匀，尤其是汉语拼音的第一个字母，有的字母仅作为韵母使用，很少成为第一个字母。譬如字母Ｖ在汉语拼音中并不存在，而字母Ｕ用于汉语拼音开头时，前面必须加Ｗ。因此，全码将汉语拼音o、yo、you归入字母Ｏ，将汉语拼音yi归入字母Ｉ，将汉语拼音yu归入字母Ｕ，都是鉴于汉语拼音字母非均匀使用的特点而作出的安排。根据全码的注音规则，将部分字元作了一定调整。例如字元“扌”，本来习惯上叫作“提手旁”，但全码中并没有将其归入字母Ｓ的范畴，而是因其与汉字“牛”相似，因而将之列入字母Ｎ下面；另如字元“饣”，习惯上叫作“食旁”，全码因其与汉字“个”相似而列入字母Ｇ下。根据汉字的相似特点，将少数简单的独体字归入一个音中，视为字元而非字元字。例如将汉字“壬”归入“王”，拼音代码定为Ｗ；将“士”归入“土”，拼音代码定为Ｔ；“夭”归入“天”，拼音代码定为Ｔ；“千”、“干”归入“于”，拼音代码定为Ｕ。这样，不仅有利于减少重码，也能够解决手写体与印刷体的差异（譬如很多人在手写中“夭”与“天”分得并不清楚），即使习惯了不符合印刷标准的手写方法，在全码的学习和使用中毫无影响。