互联网档案馆查看源代码讨论查看历史
互联网档案馆(英语:Internet Archive)是美国的一个由Alexa创始人布鲁斯特·卡利创办于1996年的非营利性的、提供互联网多媒体资料文件阅览服务的数字图书馆,总部位于加利福尼亚州旧金山的列治文区,其使命是“普及所有知识”(英语:universal access to all knowledge.)。该“档案馆”提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。 迄至2012年10月,其信息储量达到10PB。除此之外,该档案馆也是网络开放与自由化的倡议者之一[1]。
其数据是由自带的网络爬虫自动搜集的,其网站典藏档案馆网站时光机,抓取了超过1500亿的网页。
其年度预算约为1000万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会。总部雇员只有数十人,大部分雇员工作于书籍扫描中心,在红木城也有数据中心。
该数据库是国际互联网保存联盟成员,2007年被加利福尼亚州选为官方指定图书馆。档案馆收集的数据是各种各样的。截止2015年年初,互联网档案馆共收录了2400款MS-DOS游戏。
历史
1996年,卡利(Brewster Kahle)在创建盈利性的Alexa Internet时同时也创立了互联网档案馆;同年10月开始收集存储数据。不过,直到2001年开发了“时光机”前,这些数据都无法访问。1999年末扩展收集范围。
2012年8月,宣布将在其现存的130万文件的下载选项中加入BitTorrent。因为通过两个文件数据中心协调,这成为从该档案馆下载数据的最快方法。
2013年11月6日,档案馆在里奇蒙德区的总部失火[2],损坏了许多设备和一些附近的公寓,预计损失达到60万美元。
收集书目
互联网档案馆收集了世界各地的数字化图书以及各大图书馆和文化遗产机构的特殊藏品。互联网档案馆在5个国家经营着33个图书扫描中心,其活动受图书馆和基金会的财政支持。截至2013年7月,档案馆共收集了440万本书,每月的下载量超过1500万。截至2008年11月,档案馆共有100万个网络文本,总大小高达0.5PB,涵盖了原始照相图像、裁剪和歪斜的图像、PDF文件和原始OCR数据。
视频
互联网档案馆 相关视频
参考文献
- ↑ 更好地使用,互联网档案馆Wayback Machine新功能,网易,2019-10-20
- ↑ 互联网档案馆遭遇重大火灾,寻求比特币捐赠,比特币之家,2013-11-8