1
裏面我們有我們的主機數據的情況:(盤由序列讀取訪問)隨機讀取和掃描相同的HBase集羣
- 的MapReduce /星火工作
- 隨機讀取。 (通過查找訪問磁盤)
所有在同一個集羣/表內。
使用YARN我們可以管理像CPU和RAM這樣的資源,但在密集掃描期間,HDD可能會成爲瓶頸,並會降低隨機讀取性能。如何管理該資源
這種情況如何處理一般?
裏面我們有我們的主機數據的情況:(盤由序列讀取訪問)隨機讀取和掃描相同的HBase集羣
所有在同一個集羣/表內。
使用YARN我們可以管理像CPU和RAM這樣的資源,但在密集掃描期間,HDD可能會成爲瓶頸,並會降低隨機讀取性能。如何管理該資源
這種情況如何處理一般?
由於mapreduce通常不需要實時數據,人們通常會備份hbase表並在備份數據表上運行mapreduce。或者做一張桌面快照並運行mp。在上面。