2016-08-12 36 views
0

我有一個HPC集羣,我想用Icinga2來監控它的健康狀況。我爲集羣中的每個節點定義了一些檢查,但是如果超過一定百分比的節點生病,我真的很想得到一個通知。Icinga2檢查多個主機

我注意到可以定義一個虛擬主機,它代表集羣並使用Icinga域特定語言來實現我感興趣的事情(http://docs.icinga.org/icinga2/latest/doc/module/icinga2/chapter/advanced-topics?highlight-search=up_count#access-object-attributes-at-runtime)。然而,這看起來像是一個不合時宜的尷尬解決方案。

是否可以在主機組上定義這種「聚合」或「元檢查」?

回答

0

沒有任何解決方案,這樣的文件放在文檔裏幫助了很多用戶,即使它不那麼優雅。外部插件(如業務流程)可以做同樣的事情,但需要額外的配置。例如,Vagrant盒集成了Icinga Web 2模塊。

其他用戶傾向於使用check_multi或check_cluster。也不是那麼優雅。

雖然這個想法很好,並且持續很長時間,但還沒有立即實施這種功能的計劃。