假設我有以下的用戶/項目集合,其中的項目也可能是使用MapReduce的找到用戶之間的共同項目
{ "u1", "item" : [ "a", "a", "c","h" ] }
{ "u2", "item" : [ "b", "a", "f" ] }
{ "u3", "item" : [ "a", "a", "f" ] }
我想找到一個MapReduce的算法爲每個用戶重複(如用戶1),其將計算一些這樣
{ "u1_u2", "common_items" : 1 }
{ "u1_u3", "common_items" : 2 }
{ "u2_u3", "common_items" : 2 }
它基本上發現項集的每對的交叉點,並認爲作爲重複的新項目的每一對用戶之間的共同項目的數目。我是mapreduce的新手,我該怎麼做map-reduce呢?
感謝但這不是映射簡化。計算兩組之間共同元素的數量是一個例程。我要尋找一個地圖,減少處理這一問題 – user1848018
對不起,我從來沒有聽說過的'地圖reduce'之前。 – jackcogdill