在編寫MapReduce作業(特別是Hadoop,如果相關時)時,必須定義一個map()
和一個reduce()
函數,這兩個函數都會產生一系列鍵/值對。鍵和值的數據類型可以由應用程序自由定義。map()和reduce()返回相同類型的鍵/值對嗎?
在字數統計的規範示例中,兩個函數都產生(string, int)
類型的對,其中鍵爲單詞,值爲出現次數。這裏 - 以及我見過的所有其他示例 - 兩個函數之間輸出的鍵和值類型是一致的。
在MapReduce的任何應用程序中,必須/應該由map()
和reduce()
產生的鍵/值對的類型是否相同?如果是,爲什麼?