2011-12-16 29 views

回答

2

我不認爲MapReduce的是正確的工具路口2個大排序陣列的交集;因爲你的數組是排序的,所以你可以做合併合併,除非收集所有結果,而只保留出現在兩個數組中的數據。很好的線性算法。但是因爲你問...

MapReduce的Map部分接受一組(鍵,值)對。因此,給出一個數組,其中每個數組對應於其中一個數組中的元素,其中鍵是元素的值和標識其來自哪個數組的值。然後減少拋出兩個數組中沒有值的任何鍵。我將留下處理重複作爲練習。