末笔画识别码
一个汉字如果是由少数字根组成,就很容易出现重码,也就是说有两个以上的汉字都是这样的编码。如只击SF这两键,“村、杜、杆”都是木字旁,右边的“寸、土、干”都在F键上,那么怎样识别呢?我们可以看出,几个字虽编码一样,但它们的末笔画不一样,这就使我们想到以末笔画来区别它们。然而,有些重码字单从末笔画也不能识别,如“只”和“叭”,它们编码和末笔画完全一样,只是结构不一样,一个是上下型结构,一个是左右型结构,这样的字只有从结构上去区分。
五笔字型使用了一种方法,就是最后加一个识别码,这个码既包涵字的末笔画的信息,又有字的结构形式信息,叫“交叉识别码”。
五笔字型规定:左右型结构为1型;上下型结构为2型;杂合型结构为3型。
交叉识别是用汉字的末笔画所在区里的码,可要取第几位码用识别码,要看字什么型字结构,如是左右型结构为1型,就取该区第一位作识别码,上下型结构为2型字,取第二位作识别码,如果既不属于左右型又不属于上下型的字,一律视为杂合型,即三型字,就取第三位作识别码。
字的末笔画如是横,就在横区找识别码,根据字结构是属于1、2、或3型,分别补打一、二或三位的键。为了好记,我们也可把这三个键记作一横、二横、三横,这也就是说对于末笔画是横的字来说,左右结构的补打一横,上下结构的补打二横,杂合型的补打三横。
末笔画是竖,1、2、3型结构的分别用H、J、K来作识别码。
末笔画为撇,1、2、3型结构的分别用T、R、E来作识别码。
末笔画为捺或点,1、2、3型结构的分别用Y、U、I来作识别码。
末笔画为折,1、2、3型结构的分别用N、B、V来作识别码。
五笔字型对于全包围和半包围型的汉字,规定取末笔画时取被包围里面的字根的末笔画。如“边、连”,识别码只能用“车、力”字根的末笔画(如用外面的走之旁字根的末笔画岂不都一样了)。象“圆、固”等也只能取里面的笔画。如果是“九、刀、力、匕”为末字根,规定一律取折笔为末笔画。以“戈、戋”为末字根时,取撇为末笔画。
五笔字型方案规定,不足四码的汉字要加末笔识别码,还不足四码的再补打空格。不过,为了提高输入速度,五笔字型方案将一些常用汉字的编码仅取其前面的几个为简码,因此,大部分汉字用不着输入识别码。