上存儲的MapReduce中間輸出,可以使用一個Hadoop(版本1.2.0)16個節點,一個具有通過專用網絡(從站)連接的公共IP(主)及15的集羣。遠程服務器
是否有可能使用遠程服務器(除了這些16個節點),用於存儲映射器的輸出是什麼?問題是在映射階段期間節點磁盤空間不足,我無法再壓縮映射輸出。
我知道mapred-site.xml
中的mapred.local.dir
用於設置存儲tmp文件的dirs的逗號分隔列表。理想情況下,我想在遠程服務器上有一個本地目錄(默認目錄)和一個目錄。當本地磁盤已滿時,我想使用遠程磁盤。
對於這兩個屬性來說+1,的確很有用。謝謝!我將深入研究這些。我已經知道答案的第一部分,我的問題是如何做到這一點。 – vefthym 2014-10-30 11:01:51