我剛剛升級到3.1的芹菜,現在我看到這個我我的日誌::芹菜錯過心跳(on_node_lost)
on_node_lost - INFO - missed heartbeat from [email protected]_name for every queue/worker in my cluster.
按照文檔BROKER_HEARTBEAT
默認是關閉的,我還沒有配置。
我是否應該明確設置BROKER_HEARTBEAT=0
還是應該檢查其他內容?
我剛剛升級到3.1的芹菜,現在我看到這個我我的日誌::芹菜錯過心跳(on_node_lost)
on_node_lost - INFO - missed heartbeat from [email protected]_name for every queue/worker in my cluster.
按照文檔BROKER_HEARTBEAT
默認是關閉的,我還沒有配置。
我是否應該明確設置BROKER_HEARTBEAT=0
還是應該檢查其他內容?
芹菜3.1添加在新的混合和八卦程序。我也得到了一大堆錯過的心跳,並傳遞了 - 沒有閒話給我的工作人員清理它。
http://docs.celeryproject.org/en/latest/whatsnew-3.1.html#mingle-worker-synchronization http://docs.celeryproject.org/en/latest/whatsnew-3.1.html#gossip-worker-worker-communication
看到了同樣的事情,並注意到兩件事情中的日誌文件。
1)有關於日誌開始時的時間漂移和偶爾錯過的心跳的消息。
2)在日誌文件的末尾,漂移消息消失,只有錯過的心跳消息出現。
3)漂移信息消失時系統沒有變化......他們剛剛停止出現。
我認爲漂移本身可能是問題本身。
在同步涉及的所有服務器上的時間後,這些消息就消失了。對於Ubuntu,運行ntpdate作爲cron或ntpd。
我有類似的問題。我在我的案例中找到了原因。
我有兩臺服務器來運行worker。
當我使用「平」到另一臺服務器, 我發現的ping時間超過2第二個更大的,日誌將顯示「芹菜@錯過心跳」。默認心跳間隔爲2秒。
原因是我的網絡很差。 http://docs.celeryproject.org/en/latest/internals/reference/celery.worker.heartbeat.html
你能修改心跳間隔? –
是的,芹菜有--hebebeat-interval參數。[--heartbeat-interval](http://docs.celeryproject.org/en/latest/reference/celery.bin.worker.html) – mutex86
BROKER_HEARTBEAT = 0不能解決問題 –
啓動工人沒有心跳(--without-心跳)沉默日誌的這個雪崩,但我擔心,我們可能會在地毯下席捲另一個問題 –