求真百科欢迎当事人提供第一手真实资料，洗刷冤屈，终结网路霸凌。

全文检索查看源代码讨论查看历史

事实揭露揭密真相

跳转至：导航、搜索

全文检索
图片来自tcc

全文检索从文本或资料库中，不限定资料栏位，自由地萃取出讯息的技术。^[1]

执行全文检索任务的程式，一般称作搜寻引擎，它将使用者随意输入的文字，试图从资料库中，找到符合的内容。

目录

1 全文索引的相关议题
2 演算法、搜寻策略之模型
3 评量之准则
4 开放原始码之全文检索系统
5 和中文有关的议题
6 优化
7 历史及未来之趋势
8 参考文献

全文索引的相关议题

语根处理 (stemming)
符素解析器 (token parser) 1-gram, 2-gram , n-gram
断词/分词 word segmentation
倒排索引;反向索引- inverted index

演算法、搜寻策略之模型

布林式 boolean
统计模型 Probabilistic model
向量空间模型 vector base model
隐性语义模型 Latent semantic model

评量之准则

查全率(recall rate)，查准率(precision)

开放原始码之全文检索系统

和中文有关的议题

断词
语法解析
古籍议题
多语言混合

优化

剔除字(Stopwords)
词性标注
-规范文件;权威档-(authority file)
知识体系，本体论(ontology)
超连结分析(page rank)技术

历史及未来之趋势

自由语句搜寻

参考文献

↑ 全文检索，tcc

取自“https://factpedia.org/index.php?title=全文檢索&oldid=3128725”

020 图书资讯学总论