開啟主選單
求真百科
搜尋
檢視 自動標引 的原始碼
←
自動標引
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" style="float:right; margin: -10px 0px 10px 20px; text-align:left" ! <p style="background: #D6A4AB; color: #000000; margin:auto; padding:5px 0; "> '''自动标引''' </p> |- |<center><img src="https://slidesplayer.com/slide/17217915/99/images/14/%E8%87%AA%E5%8A%A8%E6%A0%87%E5%BC%95%E7%9A%84%E5%9F%BA%E6%9C%AC%E6%B5%81%E7%A8%8B+%E7%A1%AE%E5%AE%9A%E6%A0%87%E5%BC%95%E6%BA%90+%E8%BE%93%E5%85%A5%E6%A0%87%E5%BC%95%E6%BA%90%E5%86%85%E5%AE%B9+%E9%A2%84%E5%A4%84%E7%90%86+%E5%88%86%E8%AF%8D%E5%A4%84%E7%90%86+%E7%A1%AE%E5%AE%9A%E5%85%B3%E9%94%AE%E8%AF%8D+%E8%BD%AC%E6%8D%A2%E4%B8%BA%E5%8F%97%E6%8E%A7%E8%AF%8D+%E7%BB%99%E5%87%BA%E4%B8%BB%E9%A2%98%E6%A0%87%E8%AF%86%E7%AC%A6.jpg" width="280"></center><small>[https://slidesplayer.com/slide/17217915/ 圖片來自slidesplayer] </small> |} '''自动标引'''(Automatic Indexing)包括[[关键词]]自动提取(又称自动抽词标引)与自动[[赋词标引]]两种类型。 关键词自动提取是一种识别有意义且具有代表性片段或词汇的自动化技术<ref name="ref1"> 曾元显. 关键词自动提取技术与相关词反馈. 中国图书馆学会会报, 1997, 59: 59-64.</ref>。关键词自动提取在文本挖掘域被称为关键词抽取,在计算语言学领域通常着眼于术语自动识别,在訊息检索领域,就是指自动标引。自动标引属于文本訊息抽取的范畴。文本訊息抽取是从文本数据中抽取人们关注的特定的訊息。 ==作用== 由于关键词是表达文件主题意义的最小单位,因此大部分对非结构化文件的自动处理,如自动标引、自动文摘、自动分类、自动聚类、相关反馈、自动过滤、事件检测与跟踪、知识挖掘、訊息可视化、概念检索、检索提示、关联知识分析、自动问答等,都必须先进行关键词提取的动作,再进行其他的处理。可以说,关键词提取是所有文件自动处理的基础与核心技术。目前大多文档都不具有关键词,同时手工标引费力费时且主观性较强, 因此关键词自动标引是一项值得研究的技术。 ==发展过程== 自动标引研究可以分为三个阶段: 从Luhn于1957年开始进行自动标引后开始,到目前为止,自动标引研究经历了50年的发展历程。一直到20世纪90年代初,关于关键词自动提取的研究一直就没有停止过。 20世纪90年代初到90年代末,自动标引研究渐渐冷却,原因主要包括:全文索引逐渐被人采用,并且基本上能满足用户需要;传统的自动标引方法的效率到了极限;网络兴起之初的冲击与信息需求环境的改变。20世纪90年代末一直到现在,关键词自动提取的研究逐渐升温,尤其是最近几年,关键词自动提取研究进行的如火如荼,产生该现象的主要原因为:全文索引的功能越来越难以满足实际需求,用户需要更加精确的结果;另外互联网的很多服务,例如自动摘要,文档分类与聚类,文本分析,主题检索等都要依赖于关键词自动提取的结果,只有这样才能有希望从根本上提高訊息服务品質。 == 參考文獻 == {{reflist}} [[Category: 020 圖書資訊學總論]]
此頁面使用了以下模板:
Template:Main other
(
檢視原始碼
)
Template:Reflist
(
檢視原始碼
)
模块:Check for unknown parameters
(
檢視原始碼
)
返回「
自動標引
」頁面