2011-12-20 14 views
4

我們目前在我們的圖像共享網站上的多個服務器上部署了Solr。我們有1000萬圖像,每月增加1/4個月。Solr:按特定字詞的點擊率排序

到目前爲止,Solr在選擇搜索結果方面做得非常好,但我們認爲在排序/排名上還有改進的空間。我們認爲在排名中包含點擊率會顯着改善結果。

我們目前通過MongoDB收集點擊數據。我們記錄每次點擊圖片的次數與顯示次數。因此,例如:

[圖像標識符],[搜索術語],[點擊率]

「00000001」, 「香蕉皮」, 「0.1565」

「00000001」, 「香蕉」,「0.0216」

「00000001」,「猴子香蕉」,「0.0087」

我們想要做的是找到一種方法將這一特定的搜索項點擊率數據INT o我們的Solr排名。對同一個詞語點擊的圖像越多,排名越高。我們仍然能夠找到一個乾淨利落的方法。

我們希望從外部加載數據,而不是將其作爲Solr索引的一部分 - 因爲我們希望點擊數據幾乎是實時的,並希望保持我們的Solr目錄免於獲取太大了。

任何想法或想法將是非常感謝

+1

我在http://stackoverflow.com/questions/8411860/can-solr-boost-results-on-number-of-social-likes上提出了這樣的問題。 AFAIK我會從ExternalFileField中選擇,重新索引該文檔,或加入(solr 4.0以後)偶爾更新的「元」文檔和經常更新的「評分」文檔。 – aitchnyu 2011-12-21 05:06:29

回答