假設你有一個數據庫,每一個文件是從Twitter上發文,你想,與MapReduce的,生成包含另一個文檔:包含MapReduce:地圖函數中的聚合?
- 每個國家公佈的話
- 名單鳴叫的次數在這些推文中,用一個計數器來計算該詞的總點擊次數。這對於每個國家也是如此。
我的問題:聚合和計算map函數上的單詞,然後再次使用reduce函數是否正確?像這樣做,map函數的輸出代表單個推文的信息,reduce函數彙總來自同一個國家的多個推文的信息,但我不知道這是否是一種好的做法MapReduce算法...
預先感謝您!