求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

ISO 639-3檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋
ISO 639-3

中文名: ISO 639-3

出 版: 2007年2月5日

目標: 涵蓋所有語言

類 型: 代號

ISO 639-3 是國際語種代號標準,於2007年2月5日出版。[1]

它延伸了 ISO 639-2 里的 Alpha-3 code(三個字母的代號),目標是涵蓋所有的語言。所以,它是 ISO 639-1 的超集合。 ISO 639-3 是 ISO 639-2 個別語言的超集合,但是因為 ISO 639-3 沒有 ISO 639-2 的語言集合,所以 ISO 639-3 不是整個 ISO 639-2 的超集合。

自2005年7月30日發布的計劃草案,共有 7,602 個語言條目,這些語言的來源有三個:基本資料來自 ISO 639-2 所收錄的個別語言,和取自《民族語》里的現代語言調查資料。而過去歷史的各類語言及古老的語言和人工語言,則是出自 the Linguist List 的資料。

編碼空間

因為這是採用 3 個字母,所以這套 3 字母編碼理論上最多可代表 26×26×26 = 17,576 種語言。但是,因 ISO 639-2 定義了4個特別代碼、 520個預留區域和23個 B 類代碼,故此 ISO 639-3 可用的編碼只有 17,576 − 547 = 17,030 個。

其中有4個代碼用來代表特殊情況:

mis──「uncoded languages」(未編碼語言);

mul──「multiple languages」(多語種);

und──「undetermined language」(未確定的語種);

zxx──「no linguistic content」。標準中亦有一個供私人使用的範圍: qaa-qtz。

大語言

在 ISO 639-3 代碼中,以下語言被視為包含某些其他語言的大語言 (macrolanguage),如漢語被分為13種方言。

  • 阿拉伯語(ara)
  • 艾馬拉語(aym)
  • 阿塞拜疆語(aze)
  • 俾路支語(bal)
  • 比科爾語(bik)
  • 布里亞特語(bua)
  • 馬里語(chm)
  • 克里語(cre)
  • 史拉維語(den)
  • 丁卡語(din)
  • 多格拉語(doi)
  • 愛沙尼亞語(est)自2008-043號修訂,2009年1月16日生效
  • 波斯語(fas)
  • 弗里西亞語(fry)
  • 富拉語(ful)
  • 貢德語(gon)
  • 格列博語(grb)
  • 瓜拉尼語(grn)
  • 海達語(hai)
  • 塞爾維亞-克羅地亞語(hbs)
  • 苗語(hmn)
  • 因紐特語(iku)
  • 依努庇克語(ipk)
  • 猶太-阿拉伯語(jrb)
  • 卡努里語(kau)
  • Kalenjin(kln)自2007-169號修訂,2008年1月14日生效
  • 孔卡尼語(kok)
  • 科米語(kom)
  • 剛果語(kon)
  • 庫爾德語(kur)
  • 拉亨達語(lah)
  • Luyia(luy)自2007-171號修訂,2008年1月14日生效
  • 曼丁哥語(man)
  • 蒙古語(mon)
  • 馬爾瓦利語(mwr)
  • 挪威語(nor)
  • 奧克語(oci) 由2007年3月14日取消
  • 奧吉布瓦語(oji)
  • 奧洛莫語(orm)
  • 普什圖語(pus)
  • 凱楚亞語(que)
  • 拉賈斯坦語(raj)
  • 吉普賽語(rom)
  • 阿爾巴尼亞語(sqi)
  • 撒丁語(srd)
  • 斯瓦希里語(swa)
  • 古敘利亞語(syr)
  • 塔馬奇克語(tmh)
  • 烏茲別克語(uzb)
  • 依地語(yid)
  • 薩波特克語(zap)
  • 扎扎其語(zza)

集合語言

通過對七千多種語言檢查後,發現11種被列在 ISO 639-2的語言,它們之下所包含的語言並非屬於同一語種,故在ISO 639-3中被刪除。

列表參看ISO 639-2下的「用來代表集合語言的代碼」段。

參考來源

  1. [ ], , --