五筆字型
五筆字型輸入法是王永民在1983年8月發明的一種漢字輸入法。漢字編碼的方案很多,但基本依據都是漢字的讀音和字形兩種屬性。五筆字型完全依據筆畫和字形特徵對漢字進行編碼,是典型的形碼輸入法。五筆字型輸入法在使用簡體中文的地區較廣泛,是這些地區最常用的形碼輸入法。[1]
目錄
五筆字型原理
五筆字型中,字根多數是傳統的漢字偏旁部首,同時還把一些還有少量的筆畫結構作為字根,也有硬造出的一些「字根」,五筆基本字根有130種,加上一些基本字根的變型,共有200個左右。這些字根對應在鍵盤上的25個鍵上。 鍵盤上有26個英文字母鍵,五筆字根分布在除Z之外的25個鍵上。這樣每個鍵位都對應着幾個甚至是十幾個字根。 為了方便記憶,可以把這些字根按特點分區。我們知道,漢字有五種基本筆畫, 橫、豎、撇、捺、折,所有的字根都是由這五種筆畫組成的。在五筆中還規定,把「點」歸為筆畫「捺」。 按照每個字根的起筆筆畫,把這些字根分為五個「區」。以橫起筆的在1區,在鍵盤的這個位置,從字母G到A;以豎起筆的在2區,在這個位置,從字母H到L,再加上M;以撇起筆的在3區,在這個位置,從字母T到Q;以捺起筆的叫4區,在這個位置,從Y到P;以折為起筆的叫5區,在這個位置,從字母N到X。 我們說過,橫起筆的字根都在一區,但橫起筆的字根也很多,比如「一、二、大、木、七」等,將近四十個。這些字根要分布在一區的各個鍵位上。為了便於區分,我們把每個區劃分為五個位置。 每個區正好有五個字母,一個字母占一個位置,簡稱為一個「位」。 每個區有五個位,按一定順序編號,就叫區位號。比如1區順序是從G到A,G為1區第1位,它的區位號就是11,F為1區第2位,區位號就是12。 2區的順序是從字母H開始的,H的區位號為21,J的區位號為22,L的區位號就是24,M的區位號是25。 3區是從字母T開始的,T的區位號是31,R的區位號是32,到Q的區位號就是35。 區位號的順序都是有一定規律的,都是從鍵盤中間開始,向外擴展進行編號。 所以5區是從字母N開始,N的區位號就是51,B的區位號是52,X的區位號是55。 注意掌握:以橫起筆的為第一區,以豎起筆的為第二區,以撇起筆的為第三區,以捺(點)起筆的為第四區,以折起筆的為第五區。每個區有五個字母,每個字母有一個區位號,從11到15,21到25,…,51到55,一共是25個區位號,上面分布着200個左右的字根。 要想學好五筆,必須先記住每個字根所對應的鍵位。這些字根是按一定規律分配在鍵位上的,所以要掌握這個規律,便於記憶和理解。 先來練習輸入五種基本的筆畫,五筆字型的編碼中,橫、豎、撇、捺、折五種基本筆畫的鍵入方法是:按兩下每個區的第一個字母,再按兩下L鍵。比如我們要輸入撇,撇在3區,3區的第一位是T鍵,那麼在五筆狀態下,輸入ttll,「丿」就出來了。 輸入豎:豎是2區,2區第一位是H,鍵入hhll,「|」出來了!
取碼原理
之所以叫作五筆,是將漢字筆劃分為橫、豎、撇、捺、折五種。把字根或碼元按一定規律分布在25個字母鍵上(即標準的QWER鍵盤,不包括Z)。 2006年12月,王永民又在此基礎上,研究出用於手機輸入的基於6個碼元和「右手法則——前四末一」取碼法的數字王碼。
使用技巧
「Z」鍵 由於五筆字型中,採用了五種筆劃,每個字根或碼元只取前兩劃定位它們在鍵盤上的位置,所以五筆字型漢字編碼只用到了5×5=25個字母鍵。每個字的編碼中都沒有「Z」。後來大部分五筆輸入軟件都附與Z鍵查詢功能,又叫作「萬能鍵」或「萬能學習鍵」。初學者可以在對某個字不確定其拆分時,使用「Z」鍵代替不確定的字根或碼元。 也有一些五筆輸入法使用「Z」鍵來實現拼音反查五筆或符號輸入功能。 「L」鍵 與「Z」鍵的用途為大多數熟知不同,「L」鍵在五筆編碼中也有許多人不太了解的特殊用途: 單筆畫字編碼方案對單筆畫字的編碼規定為 兩個單筆畫字母+兩個L:即一(GGLL)、丨(HHLL)、丿(TTLL)、丶(YYLL)、乙(NNLL),由於豎、撇、捺構成的字不為大多數人認識,而「一」字有一級簡碼(G),乙字又不常用(偶爾用到時,一般不記得正確編碼的輸入者常會用別的輸入法代替輸入),所以這一編碼方案細節常被人忽略。 罕用字與常見詞組的衝突 詞組「勞動」與「蔻」字,如果按編碼方案,其編碼均為(APFC),按照一般的規定,重碼時應是以單字優先,可是相比之下,「勞動」是常用詞,而「蔻」字幾乎不會單獨出現,通常總是以詞組「豆蔻」的形式出現,所以,為了方便輸入、減少重碼,在最終方案中蔻字的編碼被強制設為(APFL),但非所有五筆輸入法都跟隨。由於「蔻」字的APFL編碼實在是很不合理,大多數人很難能夠記住這種輸入方式,再加上五筆輸入法中也不是沒有重碼現象,因此五筆輸入法基本上均將詞組「勞動」和「蔻」字的編碼統一都定義為規範的APFC編碼,「蔻」字的不合理的APFL編碼已基本停止使用。
優缺點
筆字型漢字輸入法具有重碼率低、錄入速度快、便於盲打等優點, 在實際工作中得到了廣泛應用,是利用率最高的中文輸入法。也是解決學生中文輸入速度慢問題的首選方案。 優點 鍵碼短、輸入快,多簡碼,一個字或一個詞組最多只有四個碼,適用於簡化字。五筆練習對分拆漢字的能力是很好的訓練,並能鍛煉個人的認字能力,會打五筆的人用字比打拚音更準確。 缺點 五筆字型使用的是字根和碼元作為輸入時的助記符,86版使用130個字根,98版更需要使用245個字根,記憶量要比拼音或注音輸入方法大。有人認為比較難記,但也有人認為由於有五筆字型口訣,並不難於記憶。
輸入軟件版本
王碼五筆輸入軟件 五筆字型共有三代定型版本:第一代——86版、第二代——98版和第三代——新世紀版。 86版也就是老式的五筆,又稱4.5版。使用130個字根,可處理GB 2312漢字集中的6763個漢字。由於習慣問題,它至今仍然是擁有用戶群最為巨大的編碼方案。編碼舉例:「那」VFBH 98版則是一種改進型的方案,其編碼的科學性更強、更易於學習和使用。使用245個碼元,可處理中、日、韓大字集中21003個漢字。但二者在編碼原則上大同小異。編碼舉例:「那」NGBH 。 雖然設計者認為,86版的字根設置不如98版和新世紀版科學。但是由於86版較先發布,使用者和輸入法程序都比98版和新世紀版多。 一、從學習的角度看,有的人包括設計者在內的認為與98版五筆相比較,86版較難學習,很多筆畫多的字沒有字根,導致很難拆分;也有的人認為由於86版較先發布,很多人已經掌握了86版的字根排布,很難再接受98版的五筆字根排布。 二、重碼問題一直是困擾漢字輸入法的一道難題,五筆字型一樣會有重碼,但兩個版本比起來,86版的重碼數較98版多,如贏、羸、嬴、蠃(YNKY),微、徽、徵(TMGT)。從使用效果上看,多數忠實於86版的用戶來說,使用時間長了,漸漸已經熟悉其重碼的部分情況,碰到輸入這些重碼字的時候會留意選擇。 三、從字形上看,86版很多字都沒有以簡化字的字形出發,而以舊字形編碼,造成很多字不按規則輸入,形成特例字。98版和新世紀版已經較為改進這一類情況,使得輸入此類字的時候能正確區分其左右,上下,外內等因素,但並沒有根本解決此問題。 四、折的部分由於向右偏移,造成不順手、不習慣。 五、86版過分在乎重碼字,以規則去區分兩個形近字,如(日與曰,未與末),但加入詞組後,重碼仍無法避免(尤、萬、尢)。98版和新世紀版在修改字根排布之後較少出現這類情況。 六、86版設計的時候只適用於簡化字,只有少數輸入法支持五筆輸入繁體字,而且繁體字輸入在極少字根下十分困難。98版和新世紀版的更新中把一些拆分過量的字根和碼元進行了整合,使之更容易支持繁體字。 「新世紀五筆輸入法是王永民在2008年推出的第三代五筆字型輸入法。「新世紀版」版走「徹底規範、親近用戶」的路線,拆字編碼隨心順手,比86版少了幾十個字根。如果86、98的用戶「與時俱進」主動改為第三代(新世紀版),可以說一點也不難!正好像會開「手排擋」車的人,改開「自動擋」一樣簡單順利!原來感到「彆扭」的地方,第三代順手了,順乎民心了!其實,因為大部分漢字的編碼都沒有改,編碼規則也保持一致,只要記住20多個字根的「新家」,專門挑那些「編碼」不同的字練上幾天就行了。 其它五筆輸入軟件 在王碼五筆出現之後,又出現了許多其它的五筆輸入法。由於86版編碼的專利開放,它們大多採用86版的編碼方式,但也有使用者個人提供98編碼的碼錶。它們在造詞等功能上加以改進,也獲得了一定的用戶群。這其中也有一部分是以五筆編碼形式為主的輸入平台,它們不僅可以以五筆方式來輸入,也可以根據用戶的需求安裝不同的碼錶以提供其它編碼的輸入方式。