定期RDS Postgresql複製延遲

我一直在觀察，我的PostgreSQL只讀副本顯示覆制滯後的週期性延遲。滯後時間似乎長達30-40分鐘，然後自動下降到0.與CPU Utilization有關聯，但它遠不及CPU限制。定期RDS Postgresql複製延遲

這是AWS Cloudwatch圖。紅線在幾秒鐘內顯示Replication Lag。藍線顯示CPU負載。

滯後VS CPU

滯後VS網絡中斷

滯後VS讀取IOPS

滯後VS寫入IOPS

雲：Amazon RDS

實例大小：db.m3.2xlarge

PostgreSQL的版本：9.3

Postgres的設置：

共享緩衝器（由RDS設置）= 7.3 GB（956978 * 8KB）

更新

更新六月，2017年5

我創建了一個新的分支副本爲我的數據庫，並指出報告軟件（DOMO）。現在，新實例中的情況看起來很穩定。現在沒有讀取流量的舊副本也是穩定的。開始懷疑某種類型的AWS配置問題或其他問題需要執行數據庫中剩餘的工件（真空？）。

RDS只讀副本滯後指標在沒有任何要複製時未更新。如果master數據庫沒有複製的更改，則複製只會在強制時間更新（即所謂的檢查點） - 從預先寫入日誌到表的數據的定期同步。

這會使圖形看起來像上面那樣。要查看真實的圖形數據，您必須在主設備上生成一些流量，例如每分鐘甚至每秒更新一些特殊序列 - 取決於您需要多少分辨率。

此外，副本圖形上主副本和網絡利用率的WAL生成日誌會很有趣 - 備選解釋是副本需要處理的流量（IO或網絡）過多，並且只能在流量停止。

2017-06-04 21:41:20 Tometzky

我已經證實，發生在主站發生更多寫操作時。附加網絡圖。我們將此副本附加到名爲DOMO的數據倉庫工具，該工具定期將整個表複製到其數據存儲中。 –

我也檢查過slave上的replay_location遠遠落後於master。警告：流：MASTER：7543524458904重播：7543440487376 :: REPLAY 83971528bytes BEHIND（00：22：38.922488秒） –

回答