2016-11-22 59 views
5

我們在AWS中運行Kubernetes集羣,並使用dd-agent DaemonSet收集DataDog中的度量標準。爲什麼我的DataDog實例報告Kubernetes「no_pod」?

我們有一個Pod顯示在我們的度量標記爲「no_pod」的指標中,並且它使用了大量資源,內存/ CPU/NetworkTx/NetworkRX。

有什麼解釋,這個吊艙是什麼,我怎麼能找到它,殺死它,重新啓動它等?

我發現dd-agent source code似乎定義了「no_pod」標籤,但我無法理解它爲什麼存在,它來自哪裏以及如何通過kubectl等找到它。

enter image description here

+0

通常「no_pod」指的是在kubernetes之外啓動的容器,但看起來像是大量的「no_pod」容器。你有可能向我們發送一張flare與你的日誌和配置,所以我們可以幫助挖掘? https://help.datadoghq.com/hc/en-us/articles/204991415-Send-logs-and-configs-to-Datadog-via-flare-command –

+0

嗨@IlanRabinovitch。感謝您的回覆。我會發一個閃光。 – jonhoare

回答

3

說話的支持團隊DataDog後,我設法找到了有關什麼no_pod豆莢以下信息。

我們Kubernetes檢查越來越從Kubernetes API,它公開彙總數據容器的列表。在這裏的公制瀏覽器配置中,您可以看到一些名爲/ docker和/的容器以及其他容器。來自container_name:/和container_name:/ docker的pod_name:no_pod度量標準只是聚合在多個容器中的度量標準。 (因此它們是圖表中最高的值是合理的。)如果您不希望圖表顯示這些聚集的容器指標,則可以克隆儀表板,然後從查詢中排除這些容器。爲此,在克隆的儀表板上,只需在JSON選項卡中編輯查詢,然後在標記範圍中添加!pod_name:no_pod。

所以看來這些豆莢是運行在集羣外的碼頭工人和根級容器將始終顯示,除非你想給他們明確我現在做的過濾掉。

非常感謝DataDog的支持人員,他們爲我調查了這個問題,並給出了關於pod的一個很好的解釋,並基本證實我可以安全地過濾掉這些問題,而不用擔心它們。

相關問題