0
在我mrjob.conf我做了額外的音量設置:亞馬遜EMR:當連接EBS捲到實例如何確保這個量是用來
Instances.InstanceGroups.member.2.EbsConfiguration.EbsBlockDeviceConfigs.member.1.VolumeSpecification.SizeInGB: 250
Instances.InstanceGroups.member.2.EbsConfiguration.EbsBlockDeviceConfigs.member.1.VolumeSpecification.VolumeType: gp2
Instances.InstanceGroups.member.2.EbsConfiguration.EbsBlockDeviceConfigs.member.1.VolumesPerInstance: 1
當我運行在羣集我見對於每個實例,我都有10GB和250GB的卷。但EMR是否使用250GB存儲空間來保存數據?如果不是如何使它工作?
我會提醒的是,EMR的最佳建議是在可能的情況下實際使用EMRFS - 即直接將S3掛載爲HDFS掛載點。在你的情況,是的,我相信它會自動拿起250 GB硬盤作爲HDFS寫入空間? EMR使用250GB存儲來保存數據嗎? – Henry
,哪種數據以及誰在生成數據? –