2011-05-13 62 views
9

道歉的問題相當開放的性質,但我認爲它是一個非常有價值的討論區域。寫一個'混沌猴子'來增加韌性

繼不久前AWS outage和恐怖的故事,跟隨它的數量巨大,我真的被通過Netflix公司(爲數不多的適用於不受損傷非常生存的混沌猴「技術」所折服。

對於那些不知道這個概念的人來說,它本質上是一個繞過你的基礎設施的小機器人,導致一路上的混亂,作爲一種不斷測試韌性的方式。

除了Jeff Atwood's Chaos Monkey發佈我已經能夠找到很少有人在其他地方被僱用。

雖然我很欣賞良好的測試驅動開發是一個堅實的基礎,但我認爲這對任何希望保持緘默的公司/組織來說都是一個很好的補充。

  • 有沒有其他人接觸過這個話題?
  • 除了連接和安全漏洞之外,您會看到如此一段代碼觸發的特定區域嗎?
  • 對此方法有任何其他想法/感受?
+2

我們已經做得很好,自己玩混沌猴子。沒有必要自動化。 2011-05-13 21:12:47

+0

一種方法是無法爲服務器提供不間斷的電源。 – Joshua 2011-05-13 21:19:44

回答

6

有幾個測試你可以做的壓力你的系統。我喜歡使用Apache Bench來加載測試寫入數據庫的頁面。我測試了既爲點擊次數和併發用戶

500個併發用戶合共5000個請求
$ AB -n 5000 -c 500網址

我知道我的網絡服務器能站起來對此,但我發現如何記錄信息存在問題。你可以指出你網站的不同方面。

如果您使用緩存,則可以在測試過程中清除緩存,以便快速恢復一切。

如果你可以複製你在一個虛擬機服務器,內存變化量,卸載硬盤,運行的磁盤空間不足,斷開網絡接口等

你可以嘗試暴力破解密碼,使確保您的系統只允許在限制該用戶速度之前進行n次登錄嘗試。

+0

+1這是我在想的那種事情 - 特別是vm bashing(幸好完全虛擬化) – isNaN1247 2011-05-13 21:33:21