2013-12-18 57 views
2

我有一個自動縮放的cloudformation,我想我已經設置了基於StatusCheckFailed_Instance替換失敗的實例。我想測試這個。我可以通過終止其中一個EC2實例來測試它嗎?謝謝!AWS自動縮放測試失敗實例

回答

2

實例狀態檢查可能會失敗的原因如下:

內存錯誤

  • 超出內存:殺進程
  • ERROR:mmu_update失敗(內存管理更新失敗)

設備錯誤

  • I/O錯誤(方框設備故障)
  • IO ERROR:既不本地也不遠程磁盤(分拆分佈式塊設備)

內核錯誤

  • request_module:失控循環modprobe(在舊版Linux上循環傳統內核modprobe)
  • 「FATAL:kernel too old」 (內核和AMI不匹配)
  • 「FATAL:無法加載/ lib/modules」或「BusyBox」(缺少內核模塊)
  • 錯誤無效內核(EC2不兼容內核)

文件系統錯誤

  • request_module:失控的循環modprobe的
  • F(在舊版本的Linux循環遺留的內核modprobe的) SCK:沒有這樣的文件或試圖打開目錄...(未找到文件系統)
  • 一般錯誤安裝的文件系統(安裝失敗)
  • VFS:無法裝入未知塊(根文件系統不匹配)的根文件系統
  • 錯誤:無法確定根設備的主要/次要號碼......(根文件系統/設備不匹配)
  • XENBUS:設備沒有驅動程序...
  • ...沒有被檢查日,檢查強制(需要文件系統檢查)
  • fsck死於退出狀態...(缺少設備)

操作系統錯誤

  • GRUB提示符(grubdom>)
  • 瞻接口eth0:設備的eth0已比預期不同的MAC地址,忽略。(硬編碼MAC地址)
  • 無法加載SELinux策略。機器處於執行模式。現在停止。 (SELinux的配置錯誤)
  • XENBUS:超時連接設備(Xenbus超時)

在我看來,那#1是最容易實現的失敗上的需求。您可以添加Web鉤子或啓動一個延遲的shell腳本來啓動一些會導致OutOfMemory失敗的進程,以確認您的自動調節配置按配置工作。

終止實例無助於測試您的配置,因爲當您優雅地終止實例時,它將從可用實例池中刪除,並且不會執行該檢查。

關於狀態檢查的更多細節可以在這裏找到:Troubleshooting Instances with Failed Status Checks