導覽
近期變更
隨機頁面
新手上路
新頁面
優質條目評選
繁體
不转换
简体
繁體
3.149.238.67
登入
工具
閱讀
檢視原始碼
特殊頁面
頁面資訊
求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。
檢視 全文檢索 的原始碼
←
全文檢索
前往:
導覽
、
搜尋
由於下列原因,您沒有權限進行 編輯此頁面 的動作:
您請求的操作只有這個群組的使用者能使用:
用戶
您可以檢視並複製此頁面的原始碼。
{| class="wikitable" style="float:right; margin: -10px 0px 10px 20px; text-align:left" ! <p style="background: #D6A4AB; color: #000000; margin:auto; padding:5px 0; "> '''全文檢索''' </p> |- |<center><img src="http://tcckm.tcc.gov.tw/tccgazFront/onlineHelp/images/search_2.jpg" width="280"></center><small>[http://tcckm.tcc.gov.tw/tccgazFront/onlineHelp/h_search.htm 圖片來自tcc] </small> |} '''全文檢索'''從文本或資料庫中,不限定資料欄位,自由地萃取出訊息的技術。<ref>[http://tcckm.tcc.gov.tw/tccgazFront/onlineHelp/h_search.htm 全文檢索],tcc</ref> 執行'''全文檢索'''任務的程式,一般稱作[[搜尋引擎]],它將使用者隨意輸入的文字,試圖從資料庫中,找到符合的內容。 ==全文索引的相關議題== *語根處理 (stemming) *[[符素]]解析器 (token parser) 1-gram, 2-gram , n-gram *[[斷詞]]/分詞 word segmentation *[[倒排索引]];[[反向索引]]- inverted index ==演算法、搜尋策略之模型== * 布林式 boolean * 統計模型 Probabilistic model * [[向量空間模型]] vector base model * 隱性語義模型 Latent semantic model ==評量之準則== *查全率(recall rate),查準率(precision) ==開放原始碼之全文檢索系統== * [[Solr|Apache Solr]] * [[BaseX]] * [[Clusterpoint|Clusterpoint Server]] [https://web.archive.org/web/20140328121334/http://www.clusterpoint.com/ (freeware licence for a single-server)] * [[DataparkSearch]] * [[Ferret search library|Ferret]] * [[Ht-//Dig]] * [[Hyper Estraier]] * [[KinoSearch]] * [[Lemur Project|Lemur/Indri]] * [[Lucene]] * [[mnoGoSearch]] * [[Sphinx (search engine)|Sphinx]] * [[Swish-e]] * [[Xapian]] * [[ElasticSearch]] ==和中文有關的議題== *斷詞 *語法解析 *古籍議題 *多語言混合 ==優化== * 剔除字(Stopwords) * 詞性標註 * -规范文件;權威檔-(authority file) * 知識體系,本體論(ontology) * 超連結分析(page rank)技術 ==歷史及未來之趨勢== * 自由語句搜尋 == 參考文獻 == {{reflist}} [[Category: 020 圖書資訊學總論]]
此頁面使用了以下模板:
Template:Main other
(
檢視原始碼
)
Template:Reflist
(
檢視原始碼
)
模块:Check for unknown parameters
(
檢視原始碼
)
返回「
全文檢索
」頁面