信息過濾檢視原始碼討論檢視歷史
信息過濾 |
信息過濾有很多定義,Belkin和Croft的文章給出了這樣的定義:信息過濾是用以描述一系列將信息傳遞給需要它的用戶處理過程的總稱。相當於傳統的數據庫來說,信息過濾系統是一個針對非結構化或半結構化的信息系統。信息過濾系統主要處理的是文本信息。信息過濾系統常常要處理巨大的數據量。
簡介
信息過濾系統的目的是從大量動態產生的信息中選擇,並展現給那些滿足他(或她)信息需求的用戶。信息過濾是根據給定的對信息的需要,只在輸入數據流中保留特定數據的行為。信息過濾是指從動態的信息流中將滿足用戶興趣的信息挑選出來,用戶的興趣一般在較長一段時間內不會改變(靜態)。信息過濾通常是在輸入數據流中移除數據,而不是在輸入流中找到數據。可以說,信息過濾的定義大致相似。簡單地講,信息過濾可以認為是滿足用戶信息需求的信息選擇過程。在內容安全領域,信息過濾是提供信息的有效流動,消除或者減少信息過量、信息混亂、信息濫用造成的危害。但在研究階段看,仍然處於較為初級的人研究階段,為用戶剔除不合適的信息是當前內容安全領域信息過濾的主要任務之一。
評價
1958年,美國的盧恩提出了「商業智能機器」的設想。在這個概念框架中,圖書館工作人員根據每個用戶的不同需求,建立相應的查詢模型,然後通過精確匹配的文本選擇方法,為每個用戶產生一個符合其查詢需求的新文本清單。同時,記錄用戶所訂閱的文本以用來更新用戶的查詢模型。他的工作涉及了信息過濾系統的每一個方面,為信息過濾的發展奠定了有力額基礎。1969年,選擇性信息分發系統(SDI)引起了人們的廣泛興趣。當時的系統大多遵循Luhn模型,只有很少的系統能夠自動更新用戶查詢模型,其他大多數仍然依靠職業的技術人員或者由用戶自己來維護,SDI興起的兩個主要原因是實時電子文本的可用性和用戶查詢模型與文本匹配計算的可實現性。1982年,Denning提出了「信息過濾」的概念。他描述了一個信息過濾的需求例子,對於實時的電子郵件,利用過濾機制識別出緊急的郵件和一般的例行郵件。之後,1986年,Mlone等人發表了較有影響的論文,並且研製了「information Lens」系統,提出了3種信息選擇模型,即認知、經濟和社會,所謂認知模式,即基於信息本身的過濾。[1]