2015-12-24 22 views
3

當使用起搏器和corosync時,我遇到了故障計數問題。如何配置「用起搏器清除過期的故障計數」時間

我的/ var/log/messages文件:

Dec 23 22:19:36 node1 attrd[1922]: notice: attrd_perform_update: Sent update 81: fail-count-named=1 

我最新的故障計數在12月23日22點19分36秒。

但經過幾分鐘:

Dec 23 22:34:47 node1 pengine[1923]: notice: unpack_rsc_op: Clearing expired failcount for named:0 on node1 
Dec 23 22:34:47 node1 pengine[1923]: notice: unpack_rsc_op: Re-initiated expired calculated failure named_last_failure_0 (rc=7, magic=0:7;21:32:0:f1d80836-3649-45c5-abd5-8c7d4ef5d7f9) on node1 

故障計數已被刪除。大約需要15分鐘。

我cib.xml:

<nvpair id="rs-resource-stickiness" name="resource-stickiness" value="300"/> 
<nvpair id="rs_defaults_migration-threshold" name="migration-threshold" value="3"/> 
<nvpair id="rs_defaults_failure-timeout" name="failure-timeout" value="60s"/> 

我不知道在哪裏失效計數到期存儲的時間,我該如何配置或刪除呢?

回答

2

我們可以結合cluster-recheck-intervalfailure-timeout當我們需要配置自動失效失敗計數。當我們想要禁用它時使用failure-timeout=0