求真百科欢迎当事人提供第一手真实资料,洗刷冤屈,终结网路霸凌。

资讯爆炸查看源代码讨论查看历史

事实揭露 揭密真相
跳转至: 导航搜索

信息爆炸

图片来自gvm

信息爆炸information explosion)是指现代出版信息数据数量的急速增加,以及因如此大量而带来的影响。

介绍

当可用数据数量增加后,资讯管理的问题变得困难,更可能导致资讯超载。线上牛津英语词典表示在 1964年3月的新政治家文章中使用了这个字词。“纽约时报”在1964年6月7日沃尔特沙利文的一篇文章中,首次在编辑内容中采用这个字词,其中将编辑过程描述为“经过多次讨论”(第11页)。这字词的最早使用似乎是在1961年4月30日出版的“纽约时报”的IBM广告补充版,和美国生物科学研究院院长 Frank Fremont-Smith 跨学科会议计划,1961年4月AIBS公报中的文章(第18页)

包括医疗保健、超市以至于政府机关等各行各业,都可观察到资料量大量增加的情形,而过去传统的新闻传播业,也蒙受现代过多资料来源的困扰,传播资讯的专业可能会被今日许多的资讯来源及相关规范而被压制。

从过多的(或以“海量的”,现代形容词)电子化数据中,分析资料以获取知识的方法(比如数据融合可帮助数据挖掘)自1970年代起便已产生,而定性研究也常被用来分析如此大量的数据。这些方法的主要目的为组织、综合、分类并系统化信息,使其更易被搜寻和使用。

增长模式

  • 全球资料储存能力由1986年的2.6艾位元组(最优化压缩)成长至1993年的15.8艾位元组,2000年的54.5艾位元组,和2007年的295艾位元组。以一片730百万位元组(Megabyte)的CD-ROM来说,这相当于全球每人于1986年拥有少于一片CD-ROM,于1993年拥有4片CD-ROM,于2000年拥有12片CD-ROM,于2007年拥有61片CD-ROM。[1]

挑战

巨量的资讯尽管在许多方面带来不少正面效益,其同时也造成了一些问题,包括隐私、法律、伦理、讯息正确性和讯息筛选等方面。讯息筛选泛指由巨量资讯当中准确筛选有用的部分,资料科学家的工作便是担当这方面的角色。其中一个例子便是数据挖掘于卫生保健方便的应用,尤其近年来随著电子健康资料库的普及而更显重要,医师必须能够从巨量资讯当中准确筛选资讯来诊断病患之病情。另一方面,一些专家也提出警告,大量讯息的公开将使得确保资讯的匿名更加困难。此外,谁是资讯的持有者?其又应如何将资讯公开?公开多久的时间?公开频率为何?亦存在法律和伦理层面上之争论。由于资讯来源过多,资讯的准确性也是一大课题。当一项资讯来源被质疑,质疑者可能会要求改正资讯中存在疑虑的部分,造成资讯的重复。爱德华·胡特(Edward Huth)指出,资讯的成本和取得的容易度也是问题之一。资讯取得的容易度可借由降低其成本和增加其功能之多样性而降低。胡特认为,交互比对法能有组织性地筛选有用的资讯,促使资讯取得之成本下降。

网页伺服器

2005年8月,全球有7,000万个网页伺服器。[2]截至2007年9月,全球共有1.35亿个网页伺服器。<ref>{{cite web|title=August 2011 Web Server Survey|url=http://news.netcraft.com/archives/web_server_survey.html%7Cpublisher=netcraft.com%7Caccessdate=2019年5月19日%7Cdate=2011年8月%7Carchive-date=2010年5月20日%7Carchive-url=https://web.archive.org/web/20100520142533/http://news.netcraft.com/a

参考文献

  1. "The Womartinhilbert.net/WorldInfoCapacity.html "free access to the study" and "video animation" .
  2. Robert H Zakon. Hobbes' Internet Timeline 10.1. zakon.org. 2010年12月15日 [2019年5月19日]. (原始内容存档于2009年5月5日).