我正在使用Amazon EMR,我能夠正常運行大多數作業。當我開始加載並在EMR羣集中生成更多數據時,我遇到了一個問題。羣集用完存儲空間。Amazon EMR:在數據節點上配置存儲
每個數據節點都是一個c1.medium實例。根據鏈接here和here每個數據節點應該有350GB的實例存儲。通過ElasticMapReduce從屬安全組,我已經能夠在我的AWS Console中驗證c1.medium數據節點正在運行並且是實例存儲。
當我在namenode上運行hadoop dfsadmin -report時,每個數據節點都有大約10GB的存儲空間。這是通過運行DF -h
[email protected]:~$ df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 9.9G 2.6G 6.8G 28%/
tmpfs 859M 0 859M 0% /lib/init/rw
udev 10M 52K 10M 1% /dev
tmpfs 859M 4.0K 859M 1% /dev/shm
我如何配置我的數據節點的充分350GB存儲推出進一步驗證?有沒有辦法使用引導操作來做到這一點?