2012-11-20 120 views
1

我已經找到了如何創建自己的非分佈式推薦,但沒有如何創建自己的分佈式推薦工作幾個教程(任何一個環節是值得歡迎的,如果你知道一個)。如何創建我自己的RecommenderJob?

在書中「亨利馬烏在行動」也有如何編寫使用Mahout中的對象映射器/減速器一些例子,但它似乎並沒有說明如何把這些工作在一起嗎?

但是存在Mahout的核心,其給出瞭如何可以做到這一點的想法項目/ RecommenderJob。我的真實意圖是,以取代第一映射器,這樣我就不必準備象夫的超出了我的數據(線看起來像「用戶ID,itemid1,itemid2,itemid3 ......」,用item.RecommenderJob我顯然需要像線「 itemid1,itemid2「,」itemid1,itemid3「,...)。

現在會是一個好主意,只是在RecommenderJob類複製和更改我需要什麼? 我已經嘗試過了,但由於此類使用是在包範圍(例如UserVectorSplitterMapper.USERS_FILE。)變量我不得不更換這些 - 這感覺並不好。

如果我寧願創建一個新的類擴展AbstractJob,並挑選出我從RecommenderJob需要的東西?然後,我真正需要的是RecommenderJob中的哪些元素?

回答

2

你的替代方案是用自己的作業會將您輸入到作業想,或者,實際上只是修改作業的形式先於工作。我不認爲複製作業並修改和定製它並不是什麼大不了的事情,如果您需要非平凡的更改,而這些更改不是(並且沒有意義)被支持爲某種配置參數。