1

我對使搜索輸出對最終用戶更具實用性存在問題。問題與算法和方法相關,然後與確切的技術或框架相關。搜索結果的相關性越來越高

在我們的產品數據庫的那一刻,可以用下面的模式來描述:

http://goo.gl/391qj

從搜索角度來看,我們已經做了非常標準的東西,用3 - 第三方文本搜索令牌分析器,處理錯誤類型和同義詞(這不是完整的列表,但正如我所說,它是在範圍之外)。但是,爲了使搜索結果更貼近現實生活中的用戶需求,我們需要執行額外的工作,這可能與Google按照相關性對索引頁面進行排名的方式類似。

  • 分析了廣泛的搜索引擎最熱門的搜索請求(它仍然是一個問題,如何讓他們),提高排名在這些項:思路,即we`ve已解決問題視爲潛在的適用索引,它們對應於(可以找到的)流行的請求;
  • 提高最新(熱門)條目的排名;
  • 提高排名最大的一組條目,這對應於流行的請求,並有共同點(這就是爲什麼它是一個羣體);

欣賞任何幫助或建議的方向,在哪裏挖。

回答

1

您可以嘗試pLSA;網上有很多參考文獻,應該有圖書館和源代碼。

編輯:

好,我把在Lucene的仔細看看最近,它似乎給一個更好的答案,什麼問題居然問(它不使用PLSA)。至於與db的集成,你可以使用Hibernate Search(儘管它看起來沒有使用Lucene直接的那麼強大)。

+0

謝謝,我們正在考慮應用它,此刻。 –