機器翻譯檢視原始碼討論檢視歷史
機器翻譯 |
機器翻譯,又稱為自動翻譯,是利用計算機將一種自然語言(源語言)轉換為另一種自然語言(目標語言)的過程。它是計算語言學的一個分支,是人工智能的終極目標之一,具有重要的科學研究價值。同時,機器翻譯又具有重要的實用價值。隨着經濟全球化及互聯網的飛速發展,機器翻譯技術在促進政治、經濟、文化交流等方面起到越來越重要的作用。
簡介
機器翻譯技術的發展一直與計算機技術、信息論、語言學等學科的發展緊密相隨。從早期的詞典匹配,到詞典結合語言學專家知識的規則翻譯,再到基於語料庫的統計機器翻譯,隨着計算機計算能力的提升和多語言信息的爆發式增長,機器翻譯技術逐漸走出象牙塔,開始為普通用戶提供實時便捷的翻譯服務。機器翻譯的研究歷史可以追溯到 20 世紀三四十年代。20世紀30年代初,法國科學家G.B.阿爾楚尼提出了用機器來進行翻譯的想法。1933年,蘇聯發明家П.П.特羅揚斯基設計了把一種語言翻譯成另一種語言的機器,並在同年9月5日登記了他的發明;但是,由於30年代技術水平還很低,他的翻譯機沒有製成。1946 年,第一台現代電子計算機 ENIAC 誕生,隨後不久,信息論的先驅、美國科學家 W. Weaver 和英國工程師A. D. Booth 在討論電子計算機的應用範圍時,於1947年提出了利用計算機進行語言自動翻譯的想法。1949年,W. Weaver 發表《翻譯備忘錄》 ,正式提出機器翻譯的思想。走過六十年的風風雨雨,機器翻譯經歷了一條曲折而漫長的發展道路,學術界一般將其劃分為如下四個階段:1954 年,美國喬治敦大學(Georgetown University) 在 IBM 公司協同下, 用 IBM-701計算機首次完成了英俄機器翻譯試驗,向公眾和科學界展示了機器翻譯的可行性,從而拉開了機器翻譯研究的序幕。中國開始這項研究也並不晚, 早在1956年,國家就把這項研究列入了全國科學工作發展規劃,課題名稱是「機器翻譯、自然語言翻譯規則的建設和自然語言的數學理論」。1957 年,中國科學院語言研究所與計算技術研究所合作開展俄漢機器翻譯試驗,翻譯了9 種不同類型的較為複雜的句子。從20世紀50年代開始到20世紀60年代前半期,機器翻譯研究呈不斷上升的趨勢。美國和前蘇聯兩個超級大國出於軍事、政治、經濟目的,均對機器翻譯項目提供了大量的資金支持,而歐洲國家由於地緣政治和經濟的需要也對機器翻譯研究給予了相當大的重視,機器翻譯一時出現熱潮。這個時期機器翻譯雖然剛剛處於開創階段,但已經進入了樂觀的繁榮期。
評價
進入 70 年代後,隨着科學技術的發展和各國科技情報交流的日趨頻繁,國與國之間的語言障礙顯得更為嚴重,傳統的人工作業方式已經遠遠不能滿足需求,迫切地需要計算機來從事翻譯工作。 同時,計算機科學、語言學研究的發展,特別是計算機硬件技術的大幅度提高以及人工智能在自然語言處理上的應用,從技術層面推動了機器翻譯研究的復甦,機器翻譯項目又開始發展起來,各種實用的以及實驗的系統被先後推出,例如 Weinder 系統、EURPOTRA 多國語翻譯系統、TAUM-METEO系統等而我國在「十年浩劫」結束後也重新振作起來,機器翻譯研究被再次提上日程。「784」工程給予了機器翻譯研究足夠的重視,80 年代中期以後,我國的機器翻譯研究發展進一步加快,首先研製成功了 KY-1 和MT/EC863 兩個英漢機譯系統,表明我國在機器翻譯技術方面取得了長足的進步。[1]