求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

信息过滤查看源代码讨论查看历史

跳转至: 导航搜索
  信息过滤

信息过滤有很多定义,Belkin和Croft的文章给出了这样的定义:信息过滤是用以描述一系列将信息传递给需要它的用户处理过程的总称。相当于传统的数据库来说,信息过滤系统是一个针对非结构化或半结构化的信息系统。信息过滤系统主要处理的是文本信息。信息过滤系统常常要处理巨大的数据量。

简介

信息过滤系统的目的是从大量动态产生的信息中选择,并展现给那些满足他(或她)信息需求的用户。信息过滤是根据给定的对信息的需要,只在输入数据流中保留特定数据的行为。信息过滤是指从动态的信息流中将满足用户兴趣的信息挑选出来,用户的兴趣一般在较长一段时间内不会改变(静态)。信息过滤通常是在输入数据流中移除数据,而不是在输入流中找到数据。可以说,信息过滤的定义大致相似。简单地讲,信息过滤可以认为是满足用户信息需求的信息选择过程。在内容安全领域,信息过滤是提供信息的有效流动,消除或者减少信息过量、信息混乱、信息滥用造成的危害。但在研究阶段看,仍然处于较为初级的人研究阶段,为用户剔除不合适的信息是当前内容安全领域信息过滤的主要任务之一。

评价

1958年,美国的卢恩提出了“商业智能机器”的设想。在这个概念框架中,图书馆工作人员根据每个用户的不同需求,建立相应的查询模型,然后通过精确匹配的文本选择方法,为每个用户产生一个符合其查询需求的新文本清单。同时,记录用户所订阅的文本以用来更新用户的查询模型。他的工作涉及了信息过滤系统的每一个方面,为信息过滤的发展奠定了有力额基础。1969年,选择性信息分发系统(SDI)引起了人们的广泛兴趣。当时的系统大多遵循Luhn模型,只有很少的系统能够自动更新用户查询模型,其他大多数仍然依靠职业的技术人员或者由用户自己来维护,SDI兴起的两个主要原因是实时电子文本的可用性和用户查询模型与文本匹配计算的可实现性。1982年,Denning提出了“信息过滤”的概念。他描述了一个信息过滤的需求例子,对于实时的电子邮件,利用过滤机制识别出紧急的邮件和一般的例行邮件。之后,1986年,Mlone等人发表了较有影响的论文,并且研制了“information Lens”系统,提出了3种信息选择模型,即认知、经济和社会,所谓认知模式,即基于信息本身的过滤[1]

参考文献