2012-11-28 188 views
15

我一直在閱讀有關使用Solr和Mahout開發推薦系統的內容。推薦使用Solr和Mahout的系統

據我瞭解,他們處理兩個不同的問題。

  1. 由於Solr的是一個搜索引擎+分類系統,它主要用於類似的建議「更喜歡這種」在Drupal - http://jamidwyer.com/d7/node/21

(在StackOverflow的或「相關」功能)

  • 在亨利馬烏的情況下,它實現機器學習等協同Filtering.It算法可以用來實現 功能,如亞馬遜建議根據用戶以前的操作。(喜歡,購買的物品)
  • 我的問題,

    使用它們來解決兩個不同的問題?

    它們可以集成嗎?

    我讀Mahout做離線處理和可擴展。這是否意味着Solr不能縮放?

    +0

    爲什麼投票結束?我敢肯定,這是一個普遍的建築問題,任何人Solr和Mahout新人 –

    +0

    這本身並不是一個壞問題,只是不適合SO。 –

    回答

    3

    你說得對,他們解決了兩個不同的問題,到目前爲止我還沒有看到/發現任何現有的可以開箱即用的集成。

    你可以做的是使用Mahout分類結果來添加進一步的信息到你的索引文件,然後可以用於提高目的。

    關於你最後的答案 - Solr可以擴展,隨着剛剛發佈的4.0版本,它甚至可以縮放比以前更好。但它解決了一個不同的目的,併爲它調整好。

    你的問題有點不確定,所以我希望這有助於某種方式。

    乾杯

    11

    這些是針對不同問題的不同工具。 Solr並沒有真正提出建議,它建議以內容爲基礎的類似文件。這不是個性化的,因爲它與用戶無關。這個問題非常好。品味/ Mahout是用於協作過濾的,它不是特定於文檔或任何其他類型的事物,並且在「相似項目」中關鍵性不同,並且建議基於用戶項目交互而不是項目屬性。

    兩者都很好,取決於你的需要和意思。沒有理由懷疑索爾。

    關於Mahout和推薦者,簡單地說,它有兩個部分。一塊(Taste)是實時的,而不是基於Hadoop的,並且可以在一臺機器上擴展到中等數據集(可能是10M個數據點)。然後Mahout添加了一個基於Hadoop的非實時批處理實現,可以擴大規模。 (廣告:我是上述的主要作者,並且正在致力於基於名爲Myrrix的下一代系統。如果您對可擴展和實時Mahout風格的推薦人感興趣,它將很有吸引力。)

    如果您有興趣在一家公司組建基於上述平臺(包括Solr)的公司,您應該查看NGDATA

    2

    如果您願意讓自己的手變髒,您可以實際使用Solr + Collaborative Filtering來製作一個非常適合搜索的推薦系統。也就是說,給定搜索S並給出搜索者的購買歷史P_i並給出其他人的購買歷史P_j其中j≠i。然後,您可以返回滿足搜索S的搜索結果,但會根據搜索者可能會基於其他類似用戶喜歡的項目進行搜索。

    下面是我寫的,可能你指出正確的方向上的博客文章:http://opensourceconnections.com/blog/2013/10/05/search-aware-product-recommendation-in-solr/

    +0

    非常好的博客文章閱讀。 –