道歉的問題相當開放的性質,但我認爲它是一個非常有價值的討論區域。寫一個'混沌猴子'來增加韌性
繼不久前AWS outage和恐怖的故事,跟隨它的數量巨大,我真的被通過Netflix公司(爲數不多的適用於不受損傷非常生存的混沌猴「技術」所折服。
對於那些不知道這個概念的人來說,它本質上是一個繞過你的基礎設施的小機器人,導致一路上的混亂,作爲一種不斷測試韌性的方式。
除了Jeff Atwood's Chaos Monkey發佈我已經能夠找到很少有人在其他地方被僱用。
雖然我很欣賞良好的測試驅動開發是一個堅實的基礎,但我認爲這對任何希望保持緘默的公司/組織來說都是一個很好的補充。
- 有沒有其他人接觸過這個話題?
- 除了連接和安全漏洞之外,您會看到如此一段代碼觸發的特定區域嗎?
- 對此方法有任何其他想法/感受?
我們已經做得很好,自己玩混沌猴子。沒有必要自動化。 –
2011-05-13 21:12:47
一種方法是無法爲服務器提供不間斷的電源。 – Joshua 2011-05-13 21:19:44