我在4核筆記本電腦上以僞分佈式模式運行任務。我如何確保所有內核都得到有效使用。 目前我的作業跟蹤器顯示一次只能執行一個作業。這是否意味着只使用一個核心?Hadoop僞分佈式模式下所有內核的完全利用率
以下是我的配置文件。
CONF /芯-site.xml中:
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
CONF/HDFS-site.xml中:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
CONF/mapred-site.xml中:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
EDIT : 根據答案,我需要在mapred-site.xml中添加以下屬性
<property>
<name>mapred.map.tasks</name>
<value>4</value>
</property>
<property>
<name>mapred.reduce.tasks</name>
<value>4</value>
</property>
mapred.map.tasks和mapred.reduce.tasks不控制每個節點的map/reduce任務數量。請在選擇答案之前嘗試確認。 –
@Praveen這是正確的,但由於他有1個節點,他至少需要建議它也使用更多的映射器,而不是僅提高每個跟蹤器的最大值。 –
@Nemo除了在mapred-site.xml中添加4的mapred。(map | reduce).tasks值之外,是否更改了mapreduce.tasktracker。(map | reduce).tasks.maximum的值以完全利用所有核心? – AST