開啟主選單

求真百科

原圖鏈接漢字:是漢字文化圈廣泛使用的一種文字,為世界上獨有的一種指示會意文字體系。

漢字( Chinese character )(日語:汉字かんじ Kanji */?韓語;zh-hk:韓語;zh-sg:韩语:한자汉字 hanja),又稱中文字華文字唐話字,是漢字文化圈廣泛使用的一種文字,為世界上獨有的一種指示會意文字體系,也是世界上唯一仍被廣泛使用並高度發展的語素文字,由中國上古時代的漢族先民所發明創製,其字體也歷經過長久改進及演變。

漢字
漢語名稱
簡化字 汉字
繁體字 汉字
越南語名稱
越南語 chữ Hán
喃字 𡨸
壯語名稱
壯語 15px[1]
Sawgun
在手动语言转换规则中检测到错误名稱
諺文 한자
漢字 汉字
日語名稱
日本漢字 Template:Audio
平假名 かんじ
原圖鏈接漢字起源

目前確切歷史,可追溯至約公元前1300年商朝甲骨文籀文金文,再到春秋戰國秦朝籀文小篆,發展至漢朝隸變,產生隸書草書以及楷書(以及衍生的行書),至唐代楷化為今日所用的手寫字體標準——正楷,也是今日普遍使用的現代漢字。

原圖鏈接倉頡畫像

漢字在古文中只稱「字」,為與少數民族文字區別而稱「漢字」,指漢人使用的文字,後者稱法在近代才開始通用,為日文借詞[2]

原圖鏈接河圖洛書

作為中文;zh-sg:华语;zh-my:华语的書寫文字,漢字是迄今為止連續使用時間最長的主要文字,也是上古時期各大文字體系中唯一傳承至今的,相較而言,古埃及古巴比倫古印度文字都早已消亡,所以有學者認為漢字是維繫中國南北長期處於統一狀態的關鍵元素之一,亦有學者將漢字列為中國第五大發明。中國歷代皆以漢字為主要官方文字,現時在中國大陸台灣均為實務上官方文字

原圖鏈接隸書碑刻

漢字在古代已發展至高度完備的水準,不單中國使用,在很長時期內還充當東亞地區唯一的國際通用文字,在20世紀前都是朝鮮半島越南琉球日本等國家的書面規範文字。除了漢語之外,古代東亞諸國都有一定程度地自行創製漢字。

原圖鏈接歐陽詢楷書

現代漢語漢字可大體分為傳統的繁體字與後起的簡化字兩大標準,前者主要用於台灣以及香港澳門,後者則由中國大陸制定並使用,且為新加坡馬來西亞華僑眾多的國家採用。非漢語體系中,日本將部分漢字自行作簡後成為現在的日本新字體韓國也製定了官方的朝鮮漢字使用規範,而歷史上曾使用過漢字的越南北韓蒙古等國,漢字現今已不再具有官方規範地位。

原圖鏈接懷素草書

目錄

「漢字」語源

 
原圖鏈接趙孟頫行書作品

元朝之前的中國,因為是東方世界少數的大國之一,沒有與他小國區分的必要,多稱呼為「」或「文字」。「漢字」一詞早出自元朝金史》卷九本紀第九,「章宗一」:「十八年,封金源郡王。始習本朝語言小字,及漢字經書,以進士完顏匡、司經徐孝美等侍讀」。《金史》也出現多次,如:「女真初無文字,及破遼,獲契丹、漢人,始通契丹、漢字,於是諸子皆學之」、「長子布輝,識女真、契丹、漢字,善騎射」,將漢族文字、女真族文字、契丹族文字之間互相區別。

 
原圖鏈接倉頡造字

清朝前期,政府官方文字是滿文,當時已用漢字一詞稱呼中國漢族的傳統文字。另外,日本人也稱呼為「漢字」,以別於由漢字衍生的假名。在南韓,漢字則與訓民正音諺文)相區別。

漢字的歷史

 
原圖鏈接王羲之書法

漢字是四大古老文字之一(還包括古埃及聖書字蘇美爾人楔形文字瑪雅文字)。

傳說漢字起源於倉頡造字。黃帝的史官倉頡根據日月形狀、鳥獸足印創造了文字,使而「天雨粟,鬼夜哭」(《淮南子》)。從歷史的角度看,複雜的漢字系統不可能由一個人發明。倉頡應該是在漢字的在手动语言转换规则中检测到错误集、整理、統一上作出了突出貢獻,所以《荀子·解蔽》中記載「好書者眾矣,而倉頡獨傳者,一也」。

字形史

原始文字

文字發明前的口頭知識在傳播和積累中有明顯缺點,原始人類使用了結繩、刻契、圖畫的方法輔助記事,後來用特徵圖形來簡化、取代圖畫。當圖形符號簡化到一定程度,並形成與語言的特定對應時,原始文字就形成了。唐蘭在《古文字學導論》中將古文字分成殷商系、西周系、六國系、秦系四系。

1994年,湖北楊家灣大溪文化遺址出土了大量陶器。在這些6000年前的陶器上發現了170多種符號,部分符號的特徵與甲骨文很類似。此外,山東大汶口出土陶器上的象形符號、西安半坡彩陶上的半坡陶符以及河南賈湖遺址發現的距今8000年前的龜甲上的賈湖契刻符號等,都可能是原始文字形成中(或形成前)不同階段的表現。但是,這些幾何符號是否是文字、是否是漢字的前身,這些仍是爭議頗多的問題。

象形指事時代

甲骨文小篆,漢字經歷了從鉅細靡遺描繪意象的方式往簡化成容易紀錄刻畫的方向變遷,字形逐步脫離事物的具體形象。這一時期的漢字也稱為古文字。唐蘭在《古文字學導論》一書中認為小篆也算作古文字。

時期的甲骨文已經是一種比較完整的文字體系。在已發現的4500多個甲骨文單字中,目前已能認出近2000字。[3]與甲骨文同期,青銅器上鑄造的文字被稱為金文或鐘鼎文。西周時期的《散氏盤》、《毛公鼎》具備很高的史料和藝術價值。

春秋時代開始,各地諸侯相爭,而原本周文化獨尊的局面逐漸破壞,各地區文化開始有「在地化」的改變趨勢。到了戰國時代以後,這種情況更明顯,在文字使用方面可以粗略依照地域分為五大系統:東方齊系、東北燕系、南方楚系、北方晉系和西方秦系文字,各系統的文字大體上相近,只有小部份文字有所差異,因此彼此文書往來並沒有太大問題。[4]

秦始皇統一六國後,李斯大篆(秦系文字)和六國古文的基礎上,進行規範和整理,制定出了小篆作為秦朝的標準書寫字體,統一了中國的文字,影響深遠。小篆呈長方形,筆畫圓潤流暢。小篆解決了各國文字間出現大量異體字的情況,「書同文」的歷史從此開始。文字的統一有力促進了不同語族間的文化傳播,對中國的統一以及東亞各國的文化交流發揮了重要作用,為世界文字史所罕見。

漢字的發展經歷了許多不同的演變。初期漢字系統的字數很少,以象形與指事的獨體字為主,大量事物以通假字來表示,使文字表述存在較大歧義。例如先秦的「文」,兼有後世的新字「紋」的功能,表示一組成各種事務的規律、型式,不單指文字的「文」,也包含野獸身上的花「紋」、布上面的織「紋」、手指的指「紋」等數種含意。

除了「凹」、「凸」等特例直到唐朝才發明[5],大部分的象形指事字很早就已經定型,成為下個時代形聲會意組字法的基礎。

形聲會意時代

為了能更精準的表述,最早從小篆的時代開始一直到現代,因應隨文明發展不斷增加的新事物,以基本的象形指事字為基礎,發展了形聲、會意的組字法,以組合方式,來細化大量的字出來,使得文書上記載越來越精密,到今天一直為造字的主力。

例如:

  • 最早海上的交通工具就只有:「舟」一種;但演化到現在,細分成「舨、舟、艇、船、艦」等不同小大規模與形制的「舟」。
  • 一開始金屬只有「金」一種,但隨著冶金技術的發展,對於金屬的知識更加豐富,「金」被細化成「金」、「銀」、「銅」、「鐵」等等。
  • 隋文帝楊堅原為随國公,但因「随」字的「辶」有不穩定之意,故去掉「辶」,而造「隋」字作為國號
  • 唐朝武周時,武則天根據「日月當空」之意而造字「曌」(同「照」字)作為她的名字。同時發明的文字還包括圀、瞾、囝等。人稱則天文字
  • 五代劉龑取「飛龍在天」之意創了自己名字內的「龑」字。
  • 在近代,由於大量西方事物的湧入,也造了許多字。例如隨著「Beer」傳入中國,如何用漢字表達是一個問題,最初譯為皮酒,後覺不妥,於1910年左右創造了「啤」字——譯為「啤酒」。(而在同一時期,朝鮮半島與日本採用了「麥酒」這個名字作為「啤酒」的譯名。)
  • 近現代科學名詞用字許多都是新造的漢字,以形聲字為多,亦有形聲兼會意字和反切字。還有一部份是古字賦予新義(如「烷」在古書中也有,意為「火」)。
    • 化學元素中,常溫下為固體的金屬元素非金屬元素一般分別用「」、「」為形旁,並以相應英文名稱中的音節發音近似的漢字為聲旁,如「」、「」、「」、「」等字;常溫下為氣體的元素從「」,如「」、「」等;「」、「」常溫下呈液態,從「」。
    • 一些化學元素用字則與其性質和功能有關,如「」言其重量「輕」,「」有「滋養生命」之意,「」有「綠色」意。
    • 一些非金屬元素加氫生成的基團常按其性質將形旁改為「」、「」(用「氨」字改),如「」、「」、「」、「」、「」、「」等,分別表示其相應的質子化的氫化物以及氫化物分子中的氫被烴基取代的化合物,其音從原字改變音調而來。
    • 熱力學中,相關的形聲字則從「」為形旁,如「」、「」等。
    • 有機化學中,命名原則如下,包括新造字和古字賦予新義:
      • 」表示含氧元素:等。
      • 」表示芳香烴:等。被用於指五個碳的環戊二烯(戊意思是五,表示五元環)。
      • 」表示含氮元素:(蛋白質舊稱)等。
      • 」表示雜環化合物吡咯噻吩等。
      • 古字用來指母體是四個環和三個支鏈的一類化學物質。
      • 古字過去被用來指具有四個環的卟啉
      • 一些基團常取其組成元素的名稱用字的偏旁合成,其發音取兩部分字音合成,類似反切。如「」(碳氫)、「」(碳氧)、「」(氫硫)、「」(氫氧)等。
      • 烴類中,則為形聲兼會意字,聲旁分別取自「完」、「稀」、「缺」,表示其不同的飽和度
    • 工程中部份字屬於新造或選用已有古字賦予新義:「」、「」等。
    • 生物學中部份字屬於新造或選用已有古字賦予新義:㺢㹢狓猛獁的「獁」、𪄳鷎鴯鶓鵎鵼鶆䴈鿕屬的「鿕」等。
  • 為了表示英制的單位,還造了一些多音節的字,如浬(海里)、嗧(加侖)、瓩(千瓦)、呎(英尺)、哩(英里)等度量衡用字。目前在台灣仍然使用,但多為單多音節混用,香港已經沒有用嗧、瓩等,而浬、呎、哩等就已經是單音節。不過這些多音節的字在1977年7月20日大陸的中國文字改革委員會和國家標準計量局所發的《關於部分計量單位名稱統一用字的通知》中被淘汰,在大陸地區不使用。

有了造好的象形、指事的獨體字為基礎,使用形聲、會意組字法隨著文明的發展,組出表示新事物的合體字,這使得記載為文時,以前述的各種不同的船來說,只要看一單位的字形,我們就知道指的是哪一種「舟」,這樣辨識理解的效率非常高;反過來,以組詞的方式就要看過前後文(或短或長)有其他哪些字才能判斷正確的意義,較缺乏辨識效率,但方便口語溝通(漢字同音字太多,聽覺不易辨識,解法一為組詞,二為如韓日語數音為一字:「浬」發音為海里)。

簡化

漢字結構複雜,異體字非常多。自古以來已經有許多的俗字,其中有一些是爲了書寫簡便,較之正字筆畫減少的簡俗字,但俗字多半是人民私下使用,正式的文書仍然是用正體字。

近代,處於強勢地位的西方文明開始進入東亞,整個漢字文化圈的各個國家中紛紛掀起了學習西方的思潮。當中有人堅持漢字的傳統,亦有鼓吹放棄使用漢字。這些鼓吹放棄漢字運動的立論「漢字落後論」,內容為:跟西方拼音文字相比,漢字是繁瑣笨拙的。尤其在近代個人電腦還沒有普遍化以前,因為漢字不能透過打字機書寫,而必須使用巨型的排版房的鉛字,也就是說漢字已成為教育及資訊化上的瓶頸。但是近代個人電腦普遍化以後,漢字能透過個人電腦輸入,此種論述已經不具說服性。許多使用漢字國家以政治推行的方式,進行了不同程度的漢字簡化,甚至還有完全拼音化的嘗試。日本的使用假名方案以及漢語多種拼音方案的出現都是基於這種考量。

1935年8月21日,中華民國國民政府教育部頒布《第一批簡體字表》,1936年2月被通令「暫緩推行」。

中華人民共和國政府1956年1月28日發布《漢字簡化方案》,1964年5月審定通過《簡化字總表》,客觀上配合了不久之後的文化大革命「破四舊」政策。1986年經少量修訂後重新發表,一直在中國大陸地區使用至今。1977年,曾公布《第二批漢字簡化方案(草案)》,發布「二簡字」,試用一段時間(約八年)後因為字形過於簡陋且混亂而停用,並於1986年正式宣布廢除。新加坡馬來西亞政府分別發布了同中國大陸《簡化字總表》相同的簡化字表。

日本政府在二戰結束後也進行了漢字簡化。1946年日本內閣公佈了《當用漢字表》,收字1850個,其中對部分漢字進行了簡化,有些簡化後的漢字與中國大陸簡化後的漢字一致,有些則有一定差異,部分為日本自創。

書體史

小篆筆畫以曲線為主,後來逐步變得直線特徵較多、更容易書寫。到漢代隸書取代小篆成為主要書體。漢代以後,漢字的書寫方式逐步從木簡和竹簡,發展到在帛、紙上的毛筆書寫。隸書的出現,奠定了現代漢字字形結構的基礎,成為古今文字的分水嶺。隸書進一步發展爲楷書,到唐代,楷體完全定形。除端正的楷書外,亦同時衍生出適於手寫的行楷,並進一步衍生出筆畫更加簡省而飛動的草書。楷書行書草書等書體都發展爲藝術。古代印刷術發明後,明朝出現了用於印刷的宋體、民初出現仿宋體,宋體亦傳入日本韓國等使用漢字的國家,同樣成爲當地通行的漢字印刷體。現代手寫體仍以楷體為標準(鋼筆字),除了傳統的宋體外,現代又陸續出現了筆畫大小粗細均衡的黑體等字形。

漢字的特點

漢字的特點有以下幾項:

  1. 字根組字:每個漢字可由物體及抽象事物構成。一個漢字偶爾只由一個構成字組成,通常是由兩個以上構成部分合體而成。漢字本身即有意義的869個聲母及265個形母的象形、指事字為最基本字根部件,稱為「字源」,通常為獨體字,例如「日」、「月」,可組成各種複合部件(如「明」,可再堆疊組合成漢字盟、萌、曌等字)、以及一般認知的字(「明」本身就是一個字)。《參考漢字的字形與編碼第三頁
  2. 表意:承上,字根本身表義,多個字根合成新義,且空間的配置對字義有影響。(朱邦復先生的字易即是探討此)
  3. 相容並蓄:各語言、各領域應用可以六書基本規則,可貼近自身領域、地域所需組出所需要之字。
  4. 書同文:漢字本身不完全表音,不同方言、語言之間,仍可書同文,以文意、字義來互相瞭解。
  5. 獨有的文化如對聯書法藝術等。
  6. 任意排列:因為漢字屬表意文字,故漢字可由上而下、由右而左、由左而右排列,不像其他表音文字只能固定一個方向讀。

漢字的語文知識

構造原理

六書是漢字組字的基本原理,在周禮中就有提到了六書,只是沒有說明具體內容。到了東漢,許慎在《說文解字》中,詳細闡述了「六書」這個漢字構造原理:象形指事會意形聲轉注假借

象形

這種造字法是依照物體的外貌特徵來描繪出來,所謂「畫成其物,隨體詰詘」是也。如日、月、山、水等四個字,最早就是描繪日、月、山、水之圖案,後來逐漸演化變成現在的造型。

指事

這是指表現抽象事情的方法,所謂「各指其事以為之」是也。如人在其上寫作「上」,人在其下寫作「下」,有人稱為抽象的象形。

會意

這個造字法,是將兩個字根組合起來,使衍生出新的含意。如「日」和「月」組起來,就是日光加月光變成「明」。「人」字和「言」字合成「信」字,意思就是人過去所言;有信,就是這個人都很遵守自己說過的話。

形聲

此乃文字內以特定形狀(字根)表特有的音。例如:胡,這個字也可為一個聲符,結合不同的屬性部件,表不同意義如蝴、湖、葫、瑚、醐等,而以同樣的發音元素(也有的是完全同音),表達不同的事物。但形聲字,也因古今語言音韻變遷,不少古代同類形聲字在今天的官話已無共同音素了,如過、蝸。

轉注

六書中轉注爭議最大。漢代許慎《說文解字》中對轉注的定義是:「建類一首,同意相受,考、老是也。」有人解釋這句話的意思是:轉注是用於兩個字互為注釋,彼此同義而不同形,如「老」、「考」二字。古時「考」可作「長壽」講,「老」、「考」相通,意義一致,即所謂「老者考也,考者老也」。詩經的《大雅·棫樸》亦云:「周王壽考。」。蘇軾的《屈原塔詩》也有「古人誰不死,何必較考折。」一語。其中的「考」皆「老」意。由於許慎對轉註定義模糊,《說文解字》一書中除此例以外再無其他字被記載為轉注字,因此,後代的文字學家針對許慎的前述的定義有許多解釋和爭議。其中包括「形轉說、聲轉說、義轉說」三類,只是這三種說法有人認為不夠全面。當代古文字家林沄認為「轉注」就是一個形體(字根)記錄兩個讀音和意義完全不同的兩個詞,例如「帚和妇」與甲骨文中的「母和女」等等。亦有觀點認為轉注不是解釋漢字字源必須的概念,中國著名文字學家、北京大學教授裘錫圭先生認為:「在今天研究漢字,根本不用去管轉注這個術語。不講轉注,完全能夠把漢字的構造講清楚。……總之,我們完全沒有必要捲入到無休無止的關於轉註定義的爭論中去。」[6]

假借

這法簡言之,借用一字,去表達別的事物。一般來說,是有一個無法描述的新事物,就借用一個發音接近或是屬性近似的字根,來表達這個新事物。例如:「又」,本來是指右手(最早可見於甲骨文)[7],但後來被假借當作別的意思。聞,本意是用耳朵聽東西的意思。例如《大學‧第七章》中有「視而不見,聽而不聞,食而不知其味」,但後來被假借成嗅覺的動詞(不過也有人認為這是錯用)。 (其中「轉注」「假借」兩項的意義,至今爭訟不休,尚無令人滿意的說法。)

總結以上古代六書,前兩項,「造字法」也;中兩項,「組字法」也;後兩項,「用字法」也。這六個原理,是古代文字學學者歸納出來的字學理論。其所含漢字構成法則,是長期演化而成的,不是任何一個人獨創的。

字形

漢字有各種不同的書寫方式,即有不同的字體;不同的字體,漢字的字體形狀不一樣。就算是同樣的字體,也會因使用地區或使用者的不同而有字形上的差異。由於各地對字形的使用並沒有統一,加之大陸地區使用「新字形」、日本使用「新字體」,便產生了許多差異。例如「刃」及「角」,在各地寫法都不盡相同。又如「口」字,台灣官方規定最後一橫要寫得超過上面的橫折露出來一點,其他地區的寫法卻是不出頭的(注意右圖「启」字的口部)。

規整的字體(如:楷書宋體隸書篆書等)書寫下的漢字是一種方塊字,每個字佔據同樣的空間。漢字包括獨體字合體字獨體字不能分割,如「文」、「中」等;合體字由基礎部件組合構成,佔了漢字的90%以上。合體字的常見組合方式有:上下結構,如:「笑」、「尖」;左右結構,如:「詞」、「科」;半包圍結構,如:「同」、「趨」;全包圍結構,如:「團」、「回」;複合結構,如:「贏」、「斑」等。漢字的基末級部件(或稱基礎部件)包括獨體字、偏旁部首和其他非字部件。

所謂的「文字」,古代是兩個東西,東漢許慎《說文解字》敘:「倉頡之初作書,蓋依類象形,故為之文,其後形聲相益,即謂之字。」;宋鄭樵《象類書》云:「獨體為文,合體為字」。這個,現代的術語叫作字根部件,漢字是以意念的表達需要組合所需部件於一方塊,合成千千萬萬的字。

鄭樵的搜集,以形為主的文有三百三十個,稱為形母,以聲為主的文共有八百七十個,稱為聲母,合計一千二百文。

但鄭樵的聲母形母已經失傳,近代周何教授依據中文資訊交換碼(CCCII)第二集的22394字的字集重新整理的結果,得出漢字有869個聲母及265個形母,共計1134個。形母:鄭樵的搜集,有三百三十個。現代的研究整理,是265個。聲母:鄭樵的搜集,有八百七十個。現代的研究整理,是869個。

末級部件,再行拆解,即為漢字的最小構成單位:筆畫。漢字的筆畫離不開「」、「」、「」、「」、「」、「」這六種基本筆畫,另外還有「」。以書法為例,對各種筆畫都有多種不同寫法,尤其以折的變化最多。

書寫漢字時,筆畫的走向和出現的先後次序,即「筆順」,是比較固定的。基本規則是,從上到下,從左到右,先橫後豎,先撇後捺,先外後內,先外後內再封口,先中間後兩邊。不同書寫體漢字的筆順可能有所差異。

各地字差異

以下舉出幾個各地字差異:

中國大陸 台灣 日本 南北韓 香港
启啓 [[Category:含有Template:ISO 639 name zh-yue的條目]]
机机 [[Category:含有Template:ISO 639 name zh-yue的條目]]

讀音

漢字是多種語言的共同書寫體系,每個字代表一個音節或數個音節(視語言而定)。此外念法上在日語以及各漢語中,讀音有「音讀」和「訓讀」之分。

上古漢語,有人認為曾存在一個漢字多個音節的情況,但目前主流看法仍是以一字一音為主。中古漢語(以切韻及廣韻音係為代表)已經確知為一字一音節。現代標準漢語中,皆由一個聲母、一個韻母聲調確定,實際用到1300多個音節。
從字源來看,由於漢語使用者習慣用不同字形書寫同音異義的語素,且同一漢字常常存在許多書寫變體,因此存在較多同音字現象(與之對比的是,西方語言習慣用同一詞形書寫同音異義的語素,因此存在較多多義詞現象,如「蝙蝠」和「球拍」在英語中都用bat書寫)。由於各種原因,漢字還有一字多音的情形,稱為多音字或破音字,此外,許多地方的漢語具有文白異讀的情況。中國其他少數民族借漢字表音時,也有存在一字多音節的情況。
漢字大致為一字一種發音,存在訓讀,但現今已不常用。
在漢字的發音上,有著多音節,如こく)、にく),也有單音節如空気(空氣)的気(き,Ki),此外有許多字因訓讀、音讀,在不同狀況,發不同音的情形。

除了日本以外,其他漢字使用地區仍有少數字使用多音節字,如「浬」(海里)、「嗧」(加仑)、「瓩」(千瓦)、吋(英寸)、哩(英里)等。台灣官方機構或民間均普遍使用,在大陸地區由於官方廢除已不使用,但一般人也理解其意思。

注音

最早的注音方法是讀若法直注法。讀若法就是用音近的字來注音,許慎的說文解字就採用這種注音方法,如「埻,射臬也,讀若准」。 直注法就是用另一個漢字來表明這個漢字的讀音,如「女為說己者容」中,使用「說者曰悅」來進行注音。

以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以發揮注音的作用,例如「袜音韈」等。

魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以透過反切法進行標註,即用第一個字的聲母和第二個字的韻母和聲調合併來注音,使得所有漢字發音都有可能組合出來。如「練,朗甸切」,即「練」的發音是「朗」的聲母與「甸」的韻母及聲調所拼成。

近代以來,又發展出了仿漢字形式的注音符號及眾多拉丁化拼音方式。注音符號一直都是台灣官方教學的一部分,學生在學習漢字前先要求必需掌握。而目前中國大陸最為廣泛使用的是漢語拼音

由於漢字以本身表義為主,注音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方世界一樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度,必須進行專門的漢語音韻學才能推測它們在上古漢語中古漢語的發音。例如「龐」從「龍」而得聲,但今日北京話前者讀「páng・ㄆㄤˊ」,後者為「lóng・ㄌㄨㄥˊ」。

潘悟雲和法國學者沙加爾認為:漢朝之前,某些漢字可能代表著兩個音節以上的發音,即這些字具有次要音節和主要音節。

漢字與詞語

漢字是漢文組成的最小單位,大半可作單字詞獨立表義。隨著語言發展,也出現了不少兩字或多字詞語,近代白話尤多,大致可分為三類:

  • 同義複詞:「遭遇」、「學習」(兩字同義)
  • 反義複詞:「勝敗」乃兵家常事(兩字反義,兩個意思都保留)
  • 偏義複詞:毫無「動靜」(兩字反義,只保留「動」義)

不過,準確掌握其複雜的形式和用法也成為了學習漢語的一種負擔。漢語中的常用詞彙約幾萬條,總詞彙量更有上百萬條,數量的龐大可能使人卻步。

在古文而言,使用單字比使用詞語來得精確且有效率,例如朱邦復先生就提倡精確使用「字」的復古作為。

漢字的數量

漢字由於是開放集合,數量並沒有準確數字,日常所使用的漢字約為幾千字。漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,共收錄9353字。其後,南朝顧野王所撰的《玉篇》據記載共收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此後收字較多的是宋朝官修的《類篇》,收字31319個;另一部宋朝官修的《集韻》中收字53525個,曾經是收字最多的一部書。

近代編集的字典收字量更高,如清朝的《康熙字典》收字47035個;台灣的《中文大字典》收字49905個;大陸的《漢語大字典》(第一版)收字54678個,(第二版)收字60370個;最新的《中華字海》收字85568個,包含了《漢語大字典》、《中文大字典》、《康熙字典》和《說文解字》的所有收字;日本的《大漢和字典》收字48902個,另有附錄1062個。21世紀已出版的字數最多的是日本《今昔文字鏡》,收字17萬個。

20世紀所新創的,還有第一批簡化字後跟第二批的「二簡字」,其中也包括社會上不少人造的文字,不過二簡字已被大陸官方廢除,只有少數字在社會上流行,但現時並沒有於計算機編碼中被收錄。

在漢字計算機編碼標準中,目前最大的漢字編碼是台灣的國家標準CNS11643,目前(4.0)共收錄可考證之正簡、日、韓語漢字共76,067個,在戶政系統等官方機構普遍使用。台灣及港澳地區民間通用的大五碼收錄正體漢字13053個。GB 18030是中華人民共和國現時最新的內碼字集,總共收錄70244個漢字;GBK收錄簡體、繁體及日語、韓語漢字20912個,而早期的GB 2312收錄簡體漢字6763個。而Unicode中日韓統一表意文字基本字集則收錄漢字20976個,另有六個擴展區、兼容補充、筆畫和部首,總數亦高達88782個字。

初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步複雜、字數大量增加的階段。過去在漢字組成基本因子(前述字根部件)研究與教學上落後,造成學習上必須逐字學習難以舉一反三,漢字數量越多學習越困難,組建新字的風氣日趨保守,也沒有相應的資訊處理技術,於是有許多單一的漢語意義是以詞表示,例如常見的雙字詞,所以近代書寫的發展多朝向造新詞而非造新字。

漢字字位數量

漢字字位(或者叫「字素」、「字種」)是指將同一個字的不同寫法(正體字、簡體字、二簡字、異體字、新字形、舊字形、訛字、缺筆字等)計算為同一個字,而不是分別計算為不同的字。例如:「够」和「够」被視為同一個漢字的不同字位變體,而不是兩個漢字。這一計算方法與英文類似,A與a寫法不同,但只是一個字母,英語一共26個字母,而不是52個。

依據中華民國教育部《異體字字典(第六版)》,漢字正字為29,921字,異體字為74,407字,另有待考字2,002字,[8]但是以上不含85字[9]和製漢字255字[10]朝鮮漢字,故(不計中日韓以外)漢字字位數為30,261字。近代編纂的字典所收的字越來越多,實際上增加的絕大多數是字位變體而不是字位。例如,收字42,174個的《康熙字典》僅僅比收字85,568個的《中華字海》少1,000個左右的字位。[11]

常用字

  中國大陸

國家語言文字工作委員會於1988年頒佈的《現代漢語常用字表》收錄3,500字(2,500個常用字,1,000個次常用字),適用於中華人民共和國

2007年中國語言生活狀況報告裡,在10.07億漢字的語料上,進行漢字使用情況數據調查,結果為:595字數的覆蓋率達到80%,964字數的覆蓋率達到90%,2394字數的覆蓋率達到99%。[12]

山西大學計算機科學系受國家語言文字工作委員會委託,抽樣統計200萬字的材料,檢測《現代漢語常用字表》收字的使用頻率。結果是:2,500常用字覆蓋率達97.97%,1,000次常用字覆蓋率達98.49%,合計共3,500字覆蓋率達99.48%。

香港

香港教育署於2000年頒佈的《常用字字形表》收錄4,759字,適用於香港

22x20px 中華民國

1979年,中華民國教育部頒佈的《常用國字標準字體表》收錄4,808字,適用於台灣

  日本

日本內閣於1946年頒佈《當用漢字》,收錄1,850漢字;文部省國語審議會(今文部科學省文化審議會)於1981年頒佈《常用漢字》,收錄1,945漢字,取代《當用漢字》。依《常用漢字》,1006個漢字在小學教授,939個在中學中教授,共計1,945個。2010年11月30日追加196個新的常用漢字,並削除5個漢字,合計共2,136字。

自1975年,日本漢字能力檢定協會推出日本漢字能力檢定,測試日本人對漢字的掌握。直至2007年,共2,716,711人考核。成績分為12級,由最高至最低排列分別為:1級、准1級、2級、准2級、3級、4級、5級、6級、7級、8級、9級、10級。

多數日文漢字為一字多音,每個漢字在不同的詞彙中有不同的發音,日文漢字會比中文漢字困難許多。

  韓國

漢文教育用基礎漢字是韓國教育中規定的標準漢字,皆為與正體字大致相同的韓文漢字。於1972年8月16日公布,數量約1,800字,在中高等院校進行普及。

筆畫最少與最多的漢字

 
原圖鏈接漢字:筆畫最多的漢字

最簡單的漢字只有一筆畫,但卻不止一個字:除了「一」字以外,「乙」、「〇」、「丶」、「丨」、「亅」、「丿」、「乀」、「乁」、「𠄌」、「𠃋」、「𠃉」、「𠃊」、「乚」等都是漢字,而且都有各自的讀音。

中文漢字中,筆畫最多的漢字可能是「見右圖」,是一種麵食的名稱,此字至今習用,其不同寫法的筆畫數在54至71畫之間不等。被傳統辭典收錄的筆畫最多的漢字為《字彙補》、《漢語大字典》中由四個「龙」字組成的「long|𪚥|由四個「龙」字組成」字,共64畫;同樣屬於64劃的字由四個「兴」字組成的「𠔻」字,收入自《中文大辭典》;之後的是由四個「雷」字組成的「䨻」字,有52劃,收錄於《說文解字》。

另外,日本漢字收錄於日本的TRON計劃中,但此字無法提供有效證據表明其確有使用,因此狀況存疑。該字由3個「龙」字和3個「云」個組合而成,共有84劃[13]。該字曾提交到當時的統一碼擴展C區,編號為JMK66147,後因擴展C區的時間原因被安排到了擴展D區,之後因找不到合適證據被撤銷[14]。最後提交到擴展G區並被接受。

漢字文化

衍生文字

漢字書寫體系是世界上最主要的基礎文字之一。在漢字的影響下,產生了許多文字。

契丹文女真文西夏文的創製受到了漢字的影響,它們跟漢字一樣都是方塊型文字,筆畫形狀也極其類似,也採用類似六書的造字法。但這些文字除個別字與漢字外形相同外,絕大部分字形都跟漢字不同,因此在Unicode中它們都是獨立區塊編碼的。

古壯字(方塊壯字)、古白字(方塊白字)、古布依字(方塊布依字)、字喃等文字可以說是漢字在其他語言中的擴充,因為它們很大一部分本身就是漢字(賦予新義),另一些則是用已有漢字偏旁組合構成新字,因此,這些文字的外觀上與漢字很相似,在Unicode中與漢字一道編入漢字區。

女書是用於記錄漢語的另一種文字,它們的造字法與六書有部分相似之處,但字的外觀與漢字差異較大,Unicode中作為獨立區塊編碼。

以上文字都因各種原因而消亡,如今除專家學者外無幾人能識。

日語的假名仮名)是由漢字的草體、簡筆演變而成的。朝鮮半島使用的諺文在創製時深受漢字影響,將數個音素堆疊為一個方塊的寫法明顯是在模仿方塊漢字。[原創研究?]諺文和日語假名一樣可以和漢字一同混寫。

此外如蒙古文滿文錫伯文等也是在漢字書寫方式和書寫工具的影響下,將從右向左書寫的源自察合台文的書寫方式改為從上到下書寫,文字的結構也隨之有所變化。

漢字文化圈

漢字是承載文化的重要工具,目前留有大量用漢字書寫的典籍。不同的方言、甚至語言都使用漢字作為共同書寫體系。在古代日本朝鮮半島越南琉球群島,以及位於婆羅洲蘭芳共和國,漢字都曾是該國正式文書的唯一系統,因而漢字在歷史上對文明的傳播分享有著重要作用。

由於漢字和發聲的聯繫不是非常密切,比較容易被其他民族所借用,如日本、朝鮮半島和越南都曾經有過不會說漢語,單純用漢字書寫的歷史階段。漢字的這個特點對於維繫一個文化圈—一個充滿各種互相不能交流的方言群體的民族——發揮了主要的作用。

漢字對周邊國家的文化產生過巨大的影響,形成了一個共同使用漢字的漢字文化圈,在日本越南朝鮮半島琉球群島,漢字被融合成它們語言的文字「汉字(かんじ)」、「汉字(한자)」、「汉字(hán tự)」。直到現在,日語中仍然把漢字認為是書寫體系的一部分。在北韓越南,已經完全不再使用漢字;在韓國,漢字的使用在近幾十年來越來越少;但是由於朝鮮語/韓語中使用了大量的漢字詞彙,並且重音現象嚴重,所以在需要嚴謹表達的場合時仍然會使用漢字。雖然在通常情況下人名、公司機構名稱等均使用韓文書寫,不過大多數的人名、公司機構均有其對應的漢字名稱。

日本

漢字於公元3世紀經朝鮮半島輾轉傳入日本。二戰後日本開始限制漢字的數量和使用,頒布了《當用漢字表》及《人名用字表》等,其中簡化了部分漢字(日本新字體),不過文學創作使用的漢字,並不在限制之列。日本除從中文中傳入的漢字外,還創造和簡化了一些漢字,如「」(十字路口)、「栃」、「峠」(山道)和「広」(廣)、「転」(轉)、「働」(勞動)等。

朝鮮半島

公元3世紀左右,漢字傳入了朝鮮半島,朝鮮語/韓語曾經完全使用漢字來書寫。相傳薛聰在當時發明了吏讀,把朝鮮語用同音或同義的漢字來表示。例如:「乙」字被用來表示韓語中的後綴「-l()」。由於有不少發音都沒有對應的漢字,所以朝鮮半島的人民又運用組字法,把兩個或多個漢字合組成為一個新的吏讀字。相傳後來的契丹文就是受到吏讀字的影響。此外尚有鄉札口訣等以漢字表記朝鮮語的方法。

1443年,朝鮮世宗大王頒布《訓民正音》,發明了諺文與漢字一起使用,但當中有不少部件仍然有昔日吏讀字的痕跡。現在的大韓民國雖禁止在正式場合下使用漢字,並停止了在中小學中教授漢字(但是從2011年開始,大韓民國李明博政府已經決定將漢字重新納入中小學的課程裡),不過漢字在民間仍在繼續使用,且可以按照個人習慣書寫,但是現在能寫一筆漂亮漢字的韓國人越來越少。朝鮮民主主義人民共和國於1948年廢除了漢字,僅保留了十幾個漢字(參見廢除漢字)。

越南

公元1世紀漢字便傳入了越南越南語也曾完全使用漢字做為書寫用文字,並在漢字的基礎上創造了喃字,但是由於書寫不便,漢字仍是主要的書寫方式。

1945年越南民主共和國成立後廢除漢字,使用了稱為「國語字」的拼音文字。現在的越南文已經看不出漢字的痕跡了。

漢字民俗

中國許多民俗都與漢字有關,例如:

  • 射虎:就是猜燈謎,也叫打燈虎,與漢字有著密切關係。舊時的射虎大致可以分成兩類,一類是文人射虎,謎面深奧、謎格複雜多樣、謎底多為四書五經中的原句;一類是市井燈謎,謎面謎底均很通俗。射虎是元宵節的一項重要活動。
  • 合文中國民間常將一些帶有吉祥含義的短語合寫為一個字,以祈求吉祥,常見的合文如「招财进宝」、「囍」(雙喜)、「黄金万両」等。
  • 諧音字:華人喜歡利用漢字的同音特點用諧音字取吉祥之意,比如蝙蝠的「蝠」諧音為幸福的「福」,於是廟宇中常見石柱刻有蝙輻。而走獸的「獸」亦諧音為「壽」。
  • 九九消寒圖:中國北方地區的一項民俗在每年數九的季節寫下「庭前垂柳珍重待春风」九個雙鈎字,這九個字每字九劃,從冬至開始每天根據天氣為一個筆畫填充顏色,到數九結束完成全圖。
  • 花鳥字:一些民間藝人用一些花卉和禽鳥的圖案拼寫成漢字,近看細節是一些花鳥畫,遠看整體卻是一幅字,這種字畫結合的藝術形式被稱作花鳥字,是一種多彩花鳥蟲魚組合書法。在中國,只有在春節廟會中,和一些節日集會中才可以看到。花鳥字在英美等西方國家也成為一種街頭藝術。早期的鳥字畫大多寫的是一些吉祥話語,以祈求吉利,現在在廟會見到的鳥字畫則以書寫顧客的姓名為主,購買者的目的也由祈求吉祥逐漸轉變為獵奇。
  • 測字:一種以求測者抽出漢字或寫下漢字,再由相命者利用漢字的形、音、義、部件、增筆、減筆、拆合等,甚至憑據書寫時的筆勢、墨的濃淡、當時環境等因素作出命相的解釋或論斷吉凶。

漢字藝術

漢字獨特優美的結構,書寫的主要工具——毛筆有多樣的表現力,因而產生了中文獨特的造型藝術——書法。而篆刻是和書法相關的藝術,用刀在石材上雕刻出篆字作為印章,尚有勒石、山壁題字等。

字體

同一個漢字,可以有不同的字體。當前漢字字體主要有篆書隷書草書行書楷書等。

漢字變化

造字

漢字歷史上是不斷在組新字的,目前的各種漢字並非同時定型於某一年代,而是應時代需要逐漸發展而來的。例如:「人」字在商朝就已出現,「凹」字和「凸」字則是在唐朝才出現的。

此外不同的行業也會因用字需求而造字。例如:中國的傳統音樂在記譜上會使用減字譜工尺譜

拉丁化

自十九世紀中葉後,亞洲和西方都發佈了很多漢字拉丁化方案,如:

現在,漢語拼音方案是使用最廣且被聯合國接受的漢字拉丁化方案。而威妥瑪拼音歷史悠久,至今仍用於台灣的人名、地名拼寫。

異體字整理

漢字中存在許多異體字,它們的意義和讀音完全相同,只是寫法不同。異體字的產生部分是由於歷史原因,有的則是人為造字,如「和、咊、龢」、「秋、秌、龝」等。

台灣也有使用所謂的異體字,例如「台」與「台」、「体」與「体」以及「学」與「学」等等。

中國大陸於1956年公布整理異體字表,廢除了大量異體字,但後來因為各種原因恢復了部分異體字。如「于」曾被當作「于」的異體字廢除掉,但在1988年發表的《現代漢語通用字表》中又恢復成為規範字,因爲姓氏中「于」和「于」同時存在,不宜合併。另外,不同地區對異體字的取捨有所不同,例如:韓國就以漢字各種異體字中最早出現的樣式為標準寫法。所以,在韓語漢字的標準中,取「甛」而不取「甜」、取「幇」而不取「帮」、取「畵」而不取「画」。

計算機處理

由於英文文字是由26個字母排列組合而成的文字,因此可以簡化輸入步驟;相比較之下漢字則不能如此,從字形上漢字雖然可以拆解成不同的部分,但是被分成的部首或偏旁數量過多,這樣不但不能達到簡化輸入的目的,反而顯得更為繁瑣。於是從漢字字音上去考慮,漢字輸入被分成少量的語音元素組合排列,反而可以達到簡化輸入的步驟。因為是語音輸入對漢字的讀音必須清楚,某些生僻字或不知道漢字發音的則會很困難,這在一定程度上限制了漢字的輸入。

由於打字機鍵盤是為歐美文字設計的,在設計時本身沒有考慮漢字輸入的問題,輸入漢字往往比輸入拼音文字困難。漢字沒有經過中文打字機的普及,直接進入了電腦中文信息處理階段。在電腦發明初期曾引起漢字能否適應電腦時代的問題,支持漢字拉丁化的學者甚至以此為理據。

隨着各種中文輸入法的出現,漢字的計算機輸入、存儲、輸出技術得到了基本解決,大大提高了中文寫作、出版、信息檢索等的效率。目前中文輸入法有上千種之多,主要包括表音輸入和表形輸入兩類,也有兩者兼之的。漢字的語音輸入、手寫識別和光學字符識別(OCR)技術也已得到廣泛應用。

如收錄數千字的GB 2312(中國大陸)、Big5CNS 11643(台灣)、HKSCS(香港)、JIS(日本)、KS X 1001(韓國)、KPS 9566(朝鮮),以及收錄兩萬多字的GBK(中國大陸)、國際標準UnicodeISO 10646等等。在這個過程中,因為技術及其他種種因素,在收錄字數,及收錄字體等方面或做不同層次的調整。

中國政府為了解決郵政戶籍整理等的用字需要,於2000年實行了一個新的漢字編碼的國家標準《漢字編碼字符集-基本集的擴充》GB 18030-2000,共收漢字27484個。後又發布了GB 18030-2005再次進行擴充,添加了42760個漢字。

漢字編碼

為進行信息交換,各漢字使用地區都制訂了一系列漢字字符集標準。

  • 國標碼在中國大陸使用。GB 2312收錄6763個漢字,GBK收錄20912個漢字,最新的GB 18030-2005收錄70244字(其中包括大量的東亞文字)。中國大陸官方要求在中國大陸出售的軟體必須支持GB 18030編碼。
  • Big5碼。收錄13053個漢字。在台灣、港澳地區使用的一字節或兩字節編碼。
  • Unicode:在國際通信化和軟體設計領域,中日韓統一表意文字編碼收集了漢語日語朝鮮語/韓語中的漢字集。
  • 宋體-方正超大字符集。2002年由微軟開發,包含GB18030-2000字符集、CJK Ext-B中的36862個漢字,共計64395個漢字[15]。並提供了增強型區位碼輸入法[16]。宋體-方正超大字符集支持這個字符集的顯示。

動態造字

隨著計算機技術的不斷發展,漢字的輸入方式越來越多樣化、速度越來越快,並且這項技術仍在不斷提高。

經過數十年的研究,很多人研究出動態造字這新興技術,即藉由資訊科技重新解放漢字原有的生命力:任何漢字都可以由基本的百來個字根(也就是漢字的字母)以二維編碼的方式即時合成為漢字。

簡單的理解,就以前面的「中央處理單元」來說,可以用「形聲」的原則創造一個新的「單字」:「芯片」,既有效率,且本身表意,學過百來個字根的,就可以知道它代表甚麽,再賦予一個讀音(通常與「心」同音),如此這般以此類推,就可以一次解決漢字形音義、以及成本高的等等問題,使漢字與西文站在同樣的資訊平等點,甚至因表意的特性,比起西文更佔新時代資訊處理的優勢(比較好做電腦理解)。

隨著新的科學技術的爆炸性進步與發展,在一個語言正常發展的情況下,描繪新發現的情狀的詞彙也會不斷發展。比如英文,其詞彙數量即不斷地發展、增長,但英文詞彙也越來越多,很多詞彙也越來越難記,甚至某些詞彙已成為專業人士的專利,普通人難以觸及;而反觀中文,任何一個抽象的英文詞彙都可以藉助常用漢字輕鬆的轉換為中文詞,大部份民眾只要曉得常用漢字,基本可以閱讀科普書籍。由於漢字是表意文字,因此很多科學術語通過形象的漢字,可以讓外行人一眼就能看出其所表達的意思。

漢字詞彙更新的實例

化學領域,尤其需要大量描繪微世界的新詞,因此化學學科漢字更新的情況最爲顯著。 化學名詞曾用了「形聲、會意造字法」,造了一系列的新字,很多是將兩個字的字根組合,以表示新的意義的字,其發音也是原來兩字發音之組合(反切法)。例如:

  • 「烴」(tīng):碳(t-)、氫(-īng)
  • 「羰」(tāng):碳(t-)、氧(-ang)
  • 「巰」(qíu):氫(q-)、硫(-íu)
  • 「羥」(qiǎng):氫(q-)、氧(-ǎng)
  • 「烷」、「烯」、「炔」:則為「形聲兼會意」字,聲旁分別取自「完」、「稀」、「缺」,並且用來表示其不同程度的飽和狀態

繁簡體漢字的比較

  • 繁體字:由中國自古承襲演變的文字,優點是單一字內含意深遠,缺點則是筆畫較多,標準寫法的書體書寫速度較慢。
  • 簡化字:相對於傳統漢字,是簡化程度比較大的,廢除且合併了很多字,也簡併了很多的部件,優點是書寫容易、快速,缺點是有時難以精密用字,辨識困難,導致同義詞增多,例如:「头发黑」,一般理解成「头髮黑」,另一種則為「头发黑」。

除了大陸使用的簡化字外,日本與韓國也分別對漢字進行了簡化。在台灣,官方用字或正式文書必須使用正體字;在手寫的非正式文書中,有些人會使用行書草書或民間的俗寫,例如:「台」(台)、「门」(门)、「与」(与);但是,不會使用簡化字中較難辨識字意的合併字,例如:「里」(裡、里)、「后」(后)、「余」(馀)、「制」(製)、「面」(麵、麪)、「谷」(穀)、「复」(复、複)、「台」(台、檯、颱),皆不簡化。

注釋

參考文獻

引用

  1. Sawndip Sawdenj (古壯字字典; [Dictionary of Ancient Zhuang Characters]), Guangxi Ethnicities Publishing (廣西民族出版社), 1989. ISBN 978-7-5363-0614-1.
  2. 「漢字(Kanji)」一詞首先用於日本,又稱真名(Mana),用來區別日本後起文字假名(Kana)之用。中國原稱「國字/中文字」,後來拼音通行後為了區別羅馬字(漢語拼音),借用日本「漢字」一詞以示區別。(何群雄/2001《漢字在日本》)
  3. 關鍵詞:甲骨文
  4. 春秋戰國紛爭和民族融合[失效連結]普通高中標準實驗教科書《歷史》必修一、必修三,人民教育出版社。
  5. 林西莉 著,李之義 譯:《漢字的故事》,貓頭鷹出版社出版。ISBN 978-986-7415-89-9
  6. 裘錫圭,《文字學概要》,1988年,商務印書館
  7. 《漢字的故事》 林西莉著,李之義譯,貓頭鷹出版社出版。ISBN 978-986-7415-89-9
  8. 中華民國教育部異體字字典編輯略例
  9. 異體字字典日本特用漢字表編輯說明
  10. 異體字字典韓國特用漢字表編輯說明
  11. 漢字字位學. [2013-04-23]. (原始內容存檔於2016-02-01). 
  12. 2007中國語言生活狀況報告
  13. tron
  14. 2018年6月提交 |bot=InternetArchiveBot |fix-attempted=no
  15. 漢典
  16. 尉遲治平,湯勤,論中文字符集、字庫及輸入法的研製. 語言研究 2006年9月第26卷 第3期