開啟主選單

求真百科

谷登堡計劃

圖片來自blogs

谷登堡計劃(Project Gutenberg,縮寫:PG),由志願者參與,致力於將文化作品的數字化和歸檔,並鼓勵創作和發行電子書。該工程肇始於1971年,是最早的數字圖書館。其中的大部分書籍都是公有領域書籍的原本,谷登堡計劃確保這些原本自由流通、自由檔案格式,有利於長期保存,並可在各種計算機上閱讀。截至2018年7月,谷登堡計劃聲稱超過57,000件館藏。

在可能的情況下,發布的格式是純文本文件,但也包括其他格式,如HTMLPDFEPUBMOBI、Plucker。大多數版本使用的語言是英語,但也可以有許多非英語的作品。有多個相關項目,提供更多的內容,包括區域性的和特定於語言的作品。谷登堡計劃也密切聯繫Distributed Proofreaders,一個校對掃描文本的以互聯網為基礎的社區。

目錄

歷史

谷登堡計劃由Michael S. Hart(1947年-2011年)於1971年啟動。當時Hart是伊利諾伊大學的學生,他獲得了學校材料研究實驗室中Xerox Sigma V大型計算機的使用權限。和善的操作員給了他一個幾乎沒有電腦使用時限的帳號,它在當時的價值後來被估算價值約100,000乃至100,000,000美元不等。Hart說他要做一些有價值的事情,讓這份饋贈"物有所值"。

這台計算機是阿帕網(全球互聯網的鼻祖)的15個節點之一。Hart認為有朝一日公眾都可以接觸計算機,因而他決定將書籍電子化,供人們自由使用。剛好他背包里有一份美國獨立宣言,該宣言也就成了谷登堡計劃的的第一份電子文本

該工程的命名是為了紀念約翰內斯·谷登堡,他是一位德國15世紀的印刷商,通過推廣使用活字印刷術推動了印刷機的革命。

1990年代中期,Hart在伊利諾伊本篤會學院進行該項目,更多的志願者參與了進來。在圖像掃描儀光學文字識別軟件得到改進並被廣泛使用前,大部分文本都是靠手工輸入。

Hart後來與卡內基梅隆大學達成協議,由對方主導谷登堡計劃的財務。隨着電子文本的增加,志願者開始替代Hart,進行日常的維護操作。

2000年,非營利組織谷登堡計劃著作歸檔基金會 (The Project Gutenberg Literary Archive Foundation Inc) 在密西西比州獲准成立,以處理相關的法律事務。給谷登堡計劃捐款可以得到減稅的優惠。工程的長期志願者Gregory Newby成為基金會的第一任首席執行官

同樣是在2000年,Charles Franks啟動了分布校對員項目,志願者從而可以將掃描的文本通過互聯網共享發布。該舉措極大地提高了加入PG的數量與種類,新的志願者也可以更容易地貢獻力量。

意大利志願者Pietro Di Miceli開發、管理了第一個谷登堡計劃的網站,並着手對在線工程進行編目。在他參與的10年間(1994年-2004年),網站獲得了不少獎項,常被收錄到"最佳網頁"列表,這也提高了工程的知名度。[1]

2004年開始,啟用了新的在線目錄,PG內容更容易瀏覽、獲取和鏈接。

谷登堡計劃現在由位於北卡羅萊納大學ibiblio主辦。

收錄範圍

到2018年4月為止,谷登堡計劃已經收錄了57,000部書籍,平均每週將新增50部。

其中主要是西方文化傳統中的文學作品,比如小說、詩歌、小故事、戲劇,除此之外,PG也收錄食譜書目以及期刊。另外還包括一些非文本內容,比如音頻文件、樂譜文件等。

收錄中主要是英文作品,但也有相當數量的德語法語意大利語西班牙語荷蘭語芬蘭語以及中文等不同語言的著作。

在可能的情況下,谷登堡以純文本的格式發布,主要使用ASCII字符集,也常被擴展為ISO-8859-1,而中文書籍幾乎全部都是以Big5(大五碼)純文本格式發布。志願者提交時也可能會採用其他格式,最常見的是HTML。不容易編輯的格式,比如PDF,對於谷登堡計劃的目標而言並不合適,但還是有一些這樣的格式被提交。近年來,有關於XML格式的討論,但相關進展還比較緩慢。

理想

Michael Hart在2004年有言「谷登堡計劃的使命很簡單:『鼓勵電子書的創建與發布。』」[2]

工程的一個口號是「推倒愚昧與無知的藩籬」,就像20世紀早期公共圖書館的興起,谷登堡的志願者志在繼續推廣文字讀寫,從而更好地繼承文化遺產。

谷登堡計劃的運作方式不是集中式的,例如,沒有一項選擇政策來指定要添加哪部著作,志願者只是針對他們感興趣的或者手頭有的著作,進行工作。

版權問題

谷登堡計劃根據美國版權法對其電子書進行版權驗證。只有版權過期者才可以加到PG檔案中來,版權失效的記錄將保存以備未來參考。

與其他數字圖書館的項目不同,谷登堡計劃不會在其出版物上聲明新的版權,從而鼓勵自由再加工、再發布。

PG的大部分書籍都依照美國的版權法律,作為公有領域發布。其中有兩種書籍,一種書籍的前段會帶有谷登堡計劃的商標,這意味着對書籍的再利用有少量的限制,限制內容寫在電子書的授權條款裡頭(例如修改後再發布,或者商業用途)。而如果電子書的前段沒有使用商標,作為公有領域的書籍就可以不受限地再利用。

谷登堡計劃也發布了一些受版權保護的書籍,根據版權所有者的說明,就有進一步的限制。

1998年的美國參議員桑尼·波諾提出並被投票通過的著作權年限延長法案,將現存的版權延長了20年。這導致本來在美國將變成公有領域的許多書谷登堡計劃將無法添加。

批評

谷登堡計劃的書籍被指學術上不夠嚴格,比如,缺少版本使用詳情介紹,缺少最初版的封面,缺少校訂工具。通過比較新舊版本,可以看到新版的電子書已經有較大改進。大部分新版的電子書都保留了版本信息以及封面。

參考文獻