2012-06-30 75 views
2

我有一個ecad實例(10GB網絡,AMI:EC2 CentOS 5.5 GPU HVM AMI(驅動程序260.19.29)(ami-42a2532b)),其中20個EBS卷附加在raid-0中。由於昨晚AWS中斷,這些卷中有9個被標記爲「受損,可能的數據不一致」,並禁用了I/O。該實例現在停止。卷正在等待「啓用I/O」。EBS Raid-0:20個EBS卷中有9個「受損」。怎麼辦?

此外,不屬於raid陣列且具有根分區的小型EBS卷也受到損害。

AWS建議啓用受損卷的I/O,然後在其上運行fsck,但當然這不適用於RAID陣列中使用的EBS卷。

爲了嘗試恢復該陣列,最安全的方法是什麼?我知道我可能會失去這一切,這就是爲什麼我們有應急計劃(只需更多的時間來恢復),但我寧願把所有的機會放在我身邊,並嘗試恢復/修復陣列。那麼看起來最安全的一系列行動呢?

謝謝。

回答

2

想給一個更新並關閉這個問題。基本上一切都很順利,我沒有任何數據損壞。 FSCK運行乾淨,並且使用此數組的並行數據庫啓動得很好,一切都很好。

下面是一些命令,幫助收集一些數據,我小心翼翼地在礦區走:

  • mdadm --detail /dev/md0 >md0_detail獲取RAID陣列的概述。
  • mdadm --examine /dev/sd[fghijklmnopqrstuvwxy] > examine_sd檢查RAID陣列的每個組件。
  • 驗證所有校驗和是否正確。
  • mount -o noatime /dev/md0 /data由於低級別測試看起來不錯,試圖安裝RAID設備。

注:

  • 設備所使用的實際fs是的ext4(軸頸)
  • 它了罰款和經歷,似乎一切都在它應該是。

進一步行動:

  • umount /data卸載執行的fsck之前RAID陣列。
  • fsck /dev/md0這一切都出來乾淨,沒有任何問題。
  • mount -o noatime /dev/md0 /data最後,安裝好設備。
+0

你是一個現場救星!!,有了這個我可以恢復我的RAID5 –