五笔字型
五笔字型输入法是王永民在1983年8月发明的一种汉字输入法。汉字编码的方案很多,但基本依据都是汉字的读音和字形两种属性。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。五笔字型输入法在使用简体中文的地区较广泛,是这些地区最常用的形码输入法。[1]
目录
五笔字型原理
五笔字型中,字根多数是传统的汉字偏旁部首,同时还把一些还有少量的笔画结构作为字根,也有硬造出的一些“字根”,五笔基本字根有130种,加上一些基本字根的变型,共有200个左右。这些字根对应在键盘上的25个键上。 键盘上有26个英文字母键,五笔字根分布在除Z之外的25个键上。这样每个键位都对应着几个甚至是十几个字根。 为了方便记忆,可以把这些字根按特点分区。我们知道,汉字有五种基本笔画, 横、竖、撇、捺、折,所有的字根都是由这五种笔画组成的。在五笔中还规定,把“点”归为笔画“捺”。 按照每个字根的起笔笔画,把这些字根分为五个“区”。以横起笔的在1区,在键盘的这个位置,从字母G到A;以竖起笔的在2区,在这个位置,从字母H到L,再加上M;以撇起笔的在3区,在这个位置,从字母T到Q;以捺起笔的叫4区,在这个位置,从Y到P;以折为起笔的叫5区,在这个位置,从字母N到X。 我们说过,横起笔的字根都在一区,但横起笔的字根也很多,比如“一、二、大、木、七”等,将近四十个。这些字根要分布在一区的各个键位上。为了便于区分,我们把每个区划分为五个位置。 每个区正好有五个字母,一个字母占一个位置,简称为一个“位”。 每个区有五个位,按一定顺序编号,就叫区位号。比如1区顺序是从G到A,G为1区第1位,它的区位号就是11,F为1区第2位,区位号就是12。 2区的顺序是从字母H开始的,H的区位号为21,J的区位号为22,L的区位号就是24,M的区位号是25。 3区是从字母T开始的,T的区位号是31,R的区位号是32,到Q的区位号就是35。 区位号的顺序都是有一定规律的,都是从键盘中间开始,向外扩展进行编号。 所以5区是从字母N开始,N的区位号就是51,B的区位号是52,X的区位号是55。 注意掌握:以横起笔的为第一区,以竖起笔的为第二区,以撇起笔的为第三区,以捺(点)起笔的为第四区,以折起笔的为第五区。每个区有五个字母,每个字母有一个区位号,从11到15,21到25,…,51到55,一共是25个区位号,上面分布着200个左右的字根。 要想学好五笔,必须先记住每个字根所对应的键位。这些字根是按一定规律分配在键位上的,所以要掌握这个规律,便于记忆和理解。 先来练习输入五种基本的笔画,五笔字型的编码中,横、竖、撇、捺、折五种基本笔画的键入方法是:按两下每个区的第一个字母,再按两下L键。比如我们要输入撇,撇在3区,3区的第一位是T键,那么在五笔状态下,输入ttll,“丿”就出来了。 输入竖:竖是2区,2区第一位是H,键入hhll,“|”出来了!
取码原理
之所以叫作五笔,是将汉字笔划分为横、竖、撇、捺、折五种。把字根或码元按一定规律分布在25个字母键上(即标准的QWER键盘,不包括Z)。 2006年12月,王永民又在此基础上,研究出用于手机输入的基于6个码元和“右手法则——前四末一”取码法的数字王码。
使用技巧
“Z”键 由于五笔字型中,采用了五种笔划,每个字根或码元只取前两划定位它们在键盘上的位置,所以五笔字型汉字编码只用到了5×5=25个字母键。每个字的编码中都没有“Z”。后来大部分五笔输入软件都附与Z键查询功能,又叫作“万能键”或“万能学习键”。初学者可以在对某个字不确定其拆分时,使用“Z”键代替不确定的字根或码元。 也有一些五笔输入法使用“Z”键来实现拼音反查五笔或符号输入功能。 “L”键 与“Z”键的用途为大多数熟知不同,“L”键在五笔编码中也有许多人不太了解的特殊用途: 单笔画字编码方案对单笔画字的编码规定为 两个单笔画字母+两个L:即一(GGLL)、丨(HHLL)、丿(TTLL)、丶(YYLL)、乙(NNLL),由于竖、撇、捺构成的字不为大多数人认识,而“一”字有一级简码(G),乙字又不常用(偶尔用到时,一般不记得正确编码的输入者常会用别的输入法代替输入),所以这一编码方案细节常被人忽略。 罕用字与常见词组的冲突 词组“劳动”与“蔻”字,如果按编码方案,其编码均为(APFC),按照一般的规定,重码时应是以单字优先,可是相比之下,“劳动”是常用词,而“蔻”字几乎不会单独出现,通常总是以词组“豆蔻”的形式出现,所以,为了方便输入、减少重码,在最终方案中蔻字的编码被强制设为(APFL),但非所有五笔输入法都跟随。由于“蔻”字的APFL编码实在是很不合理,大多数人很难能够记住这种输入方式,再加上五笔输入法中也不是没有重码现象,因此五笔输入法基本上均将词组“劳动”和“蔻”字的编码统一都定义为规范的APFC编码,“蔻”字的不合理的APFL编码已基本停止使用。
优缺点
笔字型汉字输入法具有重码率低、录入速度快、便于盲打等优点, 在实际工作中得到了广泛应用,是利用率最高的中文输入法。也是解决学生中文输入速度慢问题的首选方案。 优点 键码短、输入快,多简码,一个字或一个词组最多只有四个码,适用于简化字。五笔练习对分拆汉字的能力是很好的训练,并能锻炼个人的认字能力,会打五笔的人用字比打拼音更准确。 缺点 五笔字型使用的是字根和码元作为输入时的助记符,86版使用130个字根,98版更需要使用245个字根,记忆量要比拼音或注音输入方法大。有人认为比较难记,但也有人认为由于有五笔字型口诀,并不难于记忆。
输入软件版本
王码五笔输入软件 五笔字型共有三代定型版本:第一代——86版、第二代——98版和第三代——新世纪版。 86版也就是老式的五笔,又称4.5版。使用130个字根,可处理GB 2312汉字集中的6763个汉字。由于习惯问题,它至今仍然是拥有用户群最为巨大的编码方案。编码举例:“那”VFBH 98版则是一种改进型的方案,其编码的科学性更强、更易于学习和使用。使用245个码元,可处理中、日、韩大字集中21003个汉字。但二者在编码原则上大同小异。编码举例:“那”NGBH 。 虽然设计者认为,86版的字根设置不如98版和新世纪版科学。但是由于86版较先发布,使用者和输入法程序都比98版和新世纪版多。 一、从学习的角度看,有的人包括设计者在内的认为与98版五笔相比较,86版较难学习,很多笔画多的字没有字根,导致很难拆分;也有的人认为由于86版较先发布,很多人已经掌握了86版的字根排布,很难再接受98版的五笔字根排布。 二、重码问题一直是困扰汉字输入法的一道难题,五笔字型一样会有重码,但两个版本比起来,86版的重码数较98版多,如赢、羸、嬴、蠃(YNKY),微、徽、征(TMGT)。从使用效果上看,多数忠实于86版的用户来说,使用时间长了,渐渐已经熟悉其重码的部分情况,碰到输入这些重码字的时候会留意选择。 三、从字形上看,86版很多字都没有以简化字的字形出发,而以旧字形编码,造成很多字不按规则输入,形成特例字。98版和新世纪版已经较为改进这一类情况,使得输入此类字的时候能正确区分其左右,上下,外内等因素,但并没有根本解决此问题。 四、折的部分由于向右偏移,造成不顺手、不习惯。 五、86版过分在乎重码字,以规则去区分两个形近字,如(日与曰,未与末),但加入词组后,重码仍无法避免(尤、万、尢)。98版和新世纪版在修改字根排布之后较少出现这类情况。 六、86版设计的时候只适用于简化字,只有少数输入法支持五笔输入繁体字,而且繁体字输入在极少字根下十分困难。98版和新世纪版的更新中把一些拆分过量的字根和码元进行了整合,使之更容易支持繁体字。 “新世纪五笔输入法是王永民在2008年推出的第三代五笔字型输入法。“新世纪版”版走“彻底规范、亲近用户”的路线,拆字编码随心顺手,比86版少了几十个字根。如果86、98的用户“与时俱进”主动改为第三代(新世纪版),可以说一点也不难!正好像会开“手排挡”车的人,改开“自动挡”一样简单顺利!原来感到“别扭”的地方,第三代顺手了,顺乎民心了!其实,因为大部分汉字的编码都没有改,编码规则也保持一致,只要记住20多个字根的“新家”,专门挑那些“编码”不同的字练上几天就行了。 其它五笔输入软件 在王码五笔出现之后,又出现了许多其它的五笔输入法。由于86版编码的专利开放,它们大多采用86版的编码方式,但也有使用者个人提供98编码的码表。它们在造词等功能上加以改进,也获得了一定的用户群。这其中也有一部分是以五笔编码形式为主的输入平台,它们不仅可以以五笔方式来输入,也可以根据用户的需求安装不同的码表以提供其它编码的输入方式。