2014-01-15 67 views
10

我剛剛升級到3.1的芹菜,現在我看到這個我我的日誌::芹菜錯過心跳(on_node_lost)

on_node_lost - INFO - missed heartbeat from [email protected]_name for every queue/worker in my cluster. 

按照文檔BROKER_HEARTBEAT默認是關閉的,我還沒有配置。

我是否應該明確設置BROKER_HEARTBEAT=0還是應該檢查其他內容?

+0

BROKER_HEARTBEAT = 0不能解決問題 –

+1

啓動工人沒有心跳(--without-心跳)沉默日誌的這個雪崩,但我擔心,我們可能會在地毯下席捲另一個問題 –

回答

8

看到了同樣的事情,並注意到兩件事情中的日誌文件。

1)有關於日誌開始時的時間漂移​​和偶爾錯過的心跳的消息。

2)在日誌文件的末尾,漂移消息消失,只有錯過的心跳消息出現。

3)漂移信息消失時系統沒有變化......他們剛剛停止出現。

我認爲漂移本身可能是問題本身。

在同步涉及的所有服務器上的時間後,這些消息就消失了。對於Ubuntu,運行ntpdate作爲cron或ntpd。

1

我有類似的問題。我在我的案例中找到了原因。

我有兩臺服務器來運行worker。

當我使用「平」到另一臺服務器, 我發現的ping時間超過2第二個更大的,日誌將顯示「芹菜@錯過心跳」。默認心跳間隔爲2秒。

原因是我的網絡很差。 http://docs.celeryproject.org/en/latest/internals/reference/celery.worker.heartbeat.html

+0

你能修改心跳間隔? –

+0

是的,芹菜有--hebebeat-interval參數。[--heartbeat-interval](http://docs.celeryproject.org/en/latest/reference/celery.bin.worker.html) – mutex86