《信息檢索:實(shí)現(xiàn)和評(píng)價(jià)搜索引擎》從多個(gè)視角對(duì)信息檢索技術(shù)進(jìn)行了深入講解,內(nèi)容涵蓋了信息檢索系統(tǒng)的架構(gòu)、基礎(chǔ)技術(shù)、詞條和詞項(xiàng)、靜態(tài)和動(dòng)態(tài)倒排索引、查詢處理、索引壓縮技術(shù)、概率模型、語言模型、分類和過濾、融合和元學(xué)習(xí)、評(píng)價(jià)方法以及并行信息檢索、Web檢索和XML檢索等具體應(yīng)用。本書以模塊化的方式進(jìn)行組織,理論性強(qiáng),體系完整,同時(shí)強(qiáng)調(diào)實(shí)踐。作者以認(rèn)真嚴(yán)謹(jǐn)?shù)膽B(tài)度實(shí)現(xiàn)了書中絕大部分的主要方法,并詳盡地描述了各種方法的適用環(huán)境以及取得的效果。 《信息檢索:實(shí)現(xiàn)和評(píng)價(jià)搜索引擎》可作為高等院校信息管理與信息系統(tǒng)、計(jì)算機(jī)科學(xué)與技術(shù)、情報(bào)學(xué)、圖書館學(xué)以及電子商務(wù)等專業(yè)的高年級(jí)本科生和研究生的教材和參考書,對(duì)于從事信息檢索與網(wǎng)絡(luò)分析等實(shí)際工作的從業(yè)人員也具有較高的參考價(jià)值。 目錄: 出版者的話 譯者序 序 前言 符號(hào) 第一部分基礎(chǔ)知識(shí) 第1章緒論 1.1什么是信息檢索 1.1.1web搜索 1.1.2其他搜索應(yīng)用 1.1.3其他信息檢索應(yīng)用 1.2信息檢索系統(tǒng) 1.2.1信息檢索系統(tǒng)基礎(chǔ)架構(gòu) 1.2.2文檔及其更新 1.2.3性能評(píng)價(jià)出版者的話 譯者序 序 前言 符號(hào) 第一部分基礎(chǔ)知識(shí) 第1章緒論 1.1什么是信息檢索 1.1.1web搜索 1.1.2其他搜索應(yīng)用 1.1.3其他信息檢索應(yīng)用 1.2信息檢索系統(tǒng) 1.2.1信息檢索系統(tǒng)基礎(chǔ)架構(gòu) 1.2.2文檔及其更新 1.2.3性能評(píng)價(jià) 1.3使用電子文本 1.3.1文本格式 1.3.2英文文本中的分詞 1.3.3詞項(xiàng)分布 1.3.4語言模型 1.4測(cè)試集 1.5開源信息檢索系統(tǒng) 1.5.1lucene 1.5.2indri 1.5.3wumpus 1.6延伸閱讀 1.7練習(xí) 1.8參考文獻(xiàn) 第2章基礎(chǔ)技術(shù) 2.1倒排索引 2.1.1延伸例子:詞組查找 2.1.2實(shí)現(xiàn)倒排索引 2.1.3文檔和其他元素 2.2檢索與排名 2.2.1向量空間模型 2.2.2鄰近度排名 2.2.3布爾檢索 2.3評(píng)價(jià) 2.3.1查全率和查準(zhǔn)率 2.3.2排名檢索的有效性指標(biāo) 2.3.3創(chuàng)建測(cè)試集 2.3.4效率指標(biāo) 2.4總結(jié) 2.5延伸閱讀 2.6練習(xí) 2.7參考文獻(xiàn) 第3章詞條與詞項(xiàng) 3.1英語 3.1.1標(biāo)點(diǎn)與大寫 3.1.2詞干提取 3.1.3停詞 3.2字符 3.3字符n?gram 3.4歐洲語言 3.5cjk語言 3.6延伸閱讀 3.7練習(xí) 3.8參考文獻(xiàn) 第二部分索引 第4章靜態(tài)倒排索引 第5章查詢處理 第6章索引壓縮 第7章動(dòng)態(tài)倒排索引 第三部分檢索和排名 第8章概率檢索 第9章語言模型及其相關(guān)方法 第10章分類和過濾 第11章融合和元學(xué)習(xí) 第四部分評(píng)價(jià) 第12章度量有效性 第13章度量效率 第五部分應(yīng)用和擴(kuò)展 第14章并行信息檢索 第15章web搜索 第16章xml檢索 第六部分附錄 附錄a計(jì)算機(jī)性能
|