我不得不MapReduce和hadoop.I知道一個簡單的迭代的MapReduce程序,知道一個映射器,減速機,洗牌是什麼.. 兩個相關概念的懷疑,但仍希望瞭解以下問題何時使用身份映射器/減速器?
1 )什麼時候迭代映射減少完成?
2)我知道身份映射器/減速器給出輸入相同的輸入。 但是我們什麼時候使用身份映射器/縮減器?
我不得不MapReduce和hadoop.I知道一個簡單的迭代的MapReduce程序,知道一個映射器,減速機,洗牌是什麼.. 兩個相關概念的懷疑,但仍希望瞭解以下問題何時使用身份映射器/減速器?
1 )什麼時候迭代映射減少完成?
2)我知道身份映射器/減速器給出輸入相同的輸入。 但是我們什麼時候使用身份映射器/縮減器?
1)迭代MR算法的一個例子是Dijkstra的最短路徑算法。在每次迭代中,探索所有活動節點的最近鄰居,減少階段用於檢查目的地節點是否已經到達。其他的例子是Facebook的朋友的朋友(FoF)算法找到建議新朋友。
2)身份映射使用可用於(除其他外!)如果你只會想排序輸入。一個身份縮減器可用於例如實現尷尬的並行算法其中你只是使用映射器來執行並行任務,但你希望輸出鍵值對進行排序。
希望這讓你在路上。
請注意,除了身份縮減器,您還可以設置NO減少器(然後映射輸出未排序)。
這可能是最好的問題,作爲兩個單獨的問題。 –
身份圖是指單獨地圖嗎? –