我跑5 DAG的已經產生的base_log_folder
6GB左右,總的日誌數據在個月。我剛剛添加了remote_base_log_folder
,但它似乎並不排除登錄到base_log_folder
。刪除氣流任務日誌
反正是有隻在遠程存儲自動刪除舊的日誌文件,旋轉它們或強制氣流無法登錄磁盤(base_log_folder)?
我跑5 DAG的已經產生的base_log_folder
6GB左右,總的日誌數據在個月。我剛剛添加了remote_base_log_folder
,但它似乎並不排除登錄到base_log_folder
。刪除氣流任務日誌
反正是有隻在遠程存儲自動刪除舊的日誌文件,旋轉它們或強制氣流無法登錄磁盤(base_log_folder)?
我不認爲有一個旋轉機構,但你可以將它們存儲在S3或谷歌雲存儲作爲在這裏描述:https://airflow.incubator.apache.org/configuration.html#logs
請參閱https://github.com/teamclairvoyant/airflow-maintenance-dags
這個插件有DAG的,可以殺死暫停任務和日誌清理。 你可以抓住這些概念,並可以想出一個新的DAG,可以按照你的要求進行清理。
謝謝,我使用的是'remote_base_log_folder'存儲上GCS日誌文件的遠程登錄的選項。這會將日誌添加到GCS,但不會在本地刪除它們。我想我想知道其他人是如何處理大量的日誌文件在生產中填滿他們的磁盤。 – jompa