我們正在轉向s3,開始爲我們的網絡應用程序提供一些靜態生成的內容。我們一直在研究構建關於網站使用情況的指標體系的機制,並且我們計劃通過傳遞附加信息來記錄內容GET請求來解析S3的訪問日誌。我們碰巧遇到下列entry in the developers guide:亞馬遜S3訪問日誌文件有多可靠?
盡力而爲服務器的日誌遞送
服務器訪問日誌記錄功能 專爲最大的努力。您可以 期望針對 桶大多數請求是正確配置了 日誌記錄將導致交付日誌 記錄,並且大多數日誌記錄將 的,他們記錄的 時間在幾個小時內交付。
但是,服務器日誌記錄功能是盡力而爲地提供的 。不保證服務器 日誌的完整性和及時性。特定請求的日誌 記錄可能在實際處理請求 很長時間後纔會傳送,或者可能根本不會傳送 。服務器日誌的目的 旨在爲存儲桶 擁有者提供針對他或她的存儲桶的流量性質 的概念。它不是 意味着所有請求的完整會計 。
我們想知道其他人在交付訪問日誌方面有什麼經驗嗎?我們的選擇是構建一個HTTP服務器,並嘗試用不同的調用來度量度量標準,但我們認爲解析日誌文件可能會減少工作量。我們想知道是否有人看到沒有發生交付的情況,試圖衡量我們希望的準確程度,因爲我們收集的一些指標用於我們的一些業務流程。
公平的問題,我認爲「盡最大的努力」源於他們的「任何服務器可能崩潰」的方法。當服務器正常掛起/關閉時,它們可能會複製日誌,但它們不會保持日誌溢價(備份,有保證)的存儲空間 - 因此它們無法保證所有情況下的日誌複製。如果你想要更可靠的日誌記錄,你可以設置自己的機制將日誌移動到[S3](http://aws.amazon.com/s3/),[EBS](http://aws.amazon。 com/ebs /),[SimpleDB](http://aws.amazon.com/simpledb/)。 – Rudu 2011-02-07 16:39:10
也請看https://www.s3stat.com/。 – jarmod 2015-06-30 19:00:19