W3Cschool
恭喜您成為首批注冊用戶
獲得88經(jīng)驗(yàn)值獎勵
Solr 相關(guān)性是查詢響應(yīng)滿足正在搜索信息的用戶的程度。
查詢響應(yīng)的相關(guān)性取決于執(zhí)行查詢的上下文。一個單獨(dú)的搜索應(yīng)用程序可能會被不同的需求和期望的用戶在不同的環(huán)境中使用。例如,一個研究氣候數(shù)據(jù)的搜索引擎可能在以下的場合被使用,例如:一個研究長期氣候趨勢的大學(xué)研究人員,一個有興趣計(jì)算春季最后霜凍的可能日期的農(nóng)民,一個對降雨模式和洪水頻率感興趣的土木工程師,以及一個大學(xué)生計(jì)劃去一個地區(qū)度假,想知道要收拾什么。由于這些用戶的動機(jī)不同,對查詢的任何特定響應(yīng)的相關(guān)性也會有所不同。
查詢響應(yīng)應(yīng)該有多全面?與一般意義上的相關(guān)性一樣,這個問題的答案取決于搜索的上下文。在某些情況下,不響應(yīng)查詢找到特定文檔的成本很高,例如響應(yīng)于傳票的法定 e-discovery 發(fā)現(xiàn)搜索,而在其他情況下相當(dāng)?shù)?,例如在網(wǎng)絡(luò)上搜索蛋糕配方,會出現(xiàn)幾十個或幾百個蛋糕食譜的網(wǎng)站。在配置 Solr 時,您應(yīng)該權(quán)衡其他因素,如及時性和易用性。
上述提到的兩個例子:e-discovery 和菜譜實(shí)例,證明了與相關(guān)性相關(guān)的兩個概念的重要性:
回到上面的例子,一個 e-discovery 搜索應(yīng)用程序有 100% 召回返回與傳票有關(guān)的所有文件是非常重要的。然而,一個菜譜應(yīng)用程序提供這樣的精確度就不那么重要了。在某些情況下,在不經(jīng)意的情況下返回太多的結(jié)果可能會壓倒用戶。在某些情況下,返回較少的結(jié)果具有更高的相關(guān)性可能是最好的方法。
使用精確度和召回的概念,可以將用戶的相關(guān)性和對文檔集合的查詢進(jìn)行量化。一個完美的系統(tǒng)對每個用戶和每個查詢都有100%的精度和100%的召回。換句話說,它將檢索所有相關(guān)的文件,沒有其他的。實(shí)際上,當(dāng)談到實(shí)際系統(tǒng)中的精確度和召回率時,通常關(guān)注的是精確度和召回率,在一定數(shù)量的結(jié)果中,最常見的(也是有用的)是10個結(jié)果。
通過 faceting、查詢過濾器和其他搜索組件,可以靈活配置 Solr 應(yīng)用程序,以幫助用戶對搜索進(jìn)行微調(diào),以便為用戶返回最具有相關(guān)性的結(jié)果。也就是說,Solr 可以配置為平衡精確度和召回率,以滿足特定用戶群體的需求。
Solr 應(yīng)用程序的配置應(yīng)該考慮到:
記住所有這些因素,在Solr部署的規(guī)劃階段,通常會幫助您勾畫出您認(rèn)為搜索應(yīng)用程序應(yīng)該返回的示例查詢的響應(yīng)類型。一旦應(yīng)用程序啟動并運(yùn)行,您就可以使用一系列測試方法,如焦點(diǎn)組、內(nèi)部測試、TREC 測試和 A/B 測試來微調(diào)應(yīng)用程序的配置,以最好地滿足用戶的需求。
有關(guān)相關(guān)性的更多信息,請參閱 Grant Ingersoll 在 SearchHub.org 上提供的技術(shù)文章:調(diào)試搜索應(yīng)用程序相關(guān)性問題。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網(wǎng)安備35020302033924號
違法和不良信息舉報(bào)電話:173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯(lián)系方式:
更多建議: