2015-12-08 71 views
1

裏面我們有我們的主機數據的情況:(盤由序列讀取訪問)隨機讀取和掃描相同的HBase集羣

  • 的MapReduce /星火工作
  • 隨機讀取。 (通過查找訪問磁盤)

所有在同一個集羣/表內。

使用YARN我們可以管理像CPU和RAM這樣的資源,但在密集掃描期間,HDD可能會成爲瓶頸,並會降低隨機讀取性能。如何管理該資源

這種情況如何處理一般?

回答

0

由於mapreduce通常不需要實時數據,人們通常會備份hbase表並在備份數據表上運行mapreduce。或者做一張桌面快照並運行mp。在上面。