ISO 639-3檢視原始碼討論檢視歷史

ISO 639-3
原圖鏈接

中文名: ISO 639-3 出版: 2007年2月5日目標: 涵蓋所有語言類型: 代號

ISO 639-3 是國際語種代號標準，於2007年2月5日出版。^[1]

它延伸了 ISO 639-2 里的 Alpha-3 code（三個字母的代號），目標是涵蓋所有的語言。所以，它是 ISO 639-1 的超集合。 ISO 639-3 是 ISO 639-2 個別語言的超集合，但是因為 ISO 639-3 沒有 ISO 639-2 的語言集合，所以 ISO 639-3 不是整個 ISO 639-2 的超集合。

自2005年7月30日發布的計劃草案，共有 7,602 個語言條目，這些語言的來源有三個：基本資料來自 ISO 639-2 所收錄的個別語言，和取自《民族語》里的現代語言調查資料。而過去歷史的各類語言及古老的語言和人工語言，則是出自 the Linguist List 的資料。

編碼空間

因為這是採用 3 個字母，所以這套 3 字母編碼理論上最多可代表 26×26×26 = 17,576 種語言。但是，因 ISO 639-2 定義了4個特別代碼、 520個預留區域和23個 B 類代碼，故此 ISO 639-3 可用的編碼只有 17,576 − 547 = 17,030 個。

其中有4個代碼用來代表特殊情況：

mis──「uncoded languages」（未編碼語言）；

mul──「multiple languages」（多語種）；

und──「undetermined language」（未確定的語種）；

zxx──「no linguistic content」。標準中亦有一個供私人使用的範圍： qaa-qtz。

大語言

在 ISO 639-3 代碼中，以下語言被視為包含某些其他語言的大語言 (macrolanguage)，如漢語被分為13種方言。

阿坎語（aka）

阿拉伯語（ara）

艾馬拉語（aym）

阿塞拜疆語（aze）

俾路支語（bal）

比科爾語（bik）

布里亞特語（bua）

馬里語（chm）

克里語（cre）

特拉華語（del）

史拉維語（den）

丁卡語（din）

多格拉語（doi）

愛沙尼亞語（est）自2008-043號修訂，2009年1月16日生效

波斯語（fas）

弗里西亞語（fry）

富拉語（ful）

巴亞語（gba）

貢德語（gon）

格列博語（grb）

瓜拉尼語（grn）

海達語（hai）

塞爾維亞-克羅地亞語（hbs）

苗語（hmn）

因紐特語（iku）

依努庇克語（ipk）

猶太-阿拉伯語（jrb）

卡努里語（kau）

Kalenjin（kln）自2007-169號修訂，2008年1月14日生效

孔卡尼語（kok）

科米語（kom）

剛果語（kon）

克佩勒語（kpe）

庫爾德語（kur）

拉亨達語（lah）

Luyia（luy）自2007-171號修訂，2008年1月14日生效

曼丁哥語（man）

馬達加斯加語（mlg）

蒙古語（mon）

馬來語（msa）

馬爾瓦利語（mwr）

挪威語（nor）

奧克語（oci）由2007年3月14日取消

奧吉布瓦語（oji）

奧洛莫語（orm）

普什圖語（pus）

凱楚亞語（que）

拉賈斯坦語（raj）

吉普賽語（rom）

阿爾巴尼亞語（sqi）

撒丁語（srd）

斯瓦希里語（swa）

古敘利亞語（syr）

塔馬奇克語（tmh）

烏茲別克語（uzb）

依地語（yid）

薩波特克語（zap）

壯語（zha）

漢語（zho）

扎扎其語（zza）

集合語言

通過對七千多種語言檢查後，發現11種被列在 ISO 639-2的語言，它們之下所包含的語言並非屬於同一語種，故在ISO 639-3中被刪除。

列表參看ISO 639-2下的「用來代表集合語言的代碼」段。

參考來源

↑ [ ], , --

[1] [ ], , --

[1]

ISO 639-3檢視原始碼討論檢視歷史

目錄

編碼空間

大語言

集合語言

參考來源