我們有一個進程將文件上傳到S3。事實上,這是間接的。我們使用Amazon Elastic MapReduce(EMR),並將Hadoop從多個不同的任務節點提交到S3。然後,在Hadoop作業成功完成後,該進程的另一部分使用Hadoop的FileSystem.createNewFile()從主節點創建一些文件。S3如何在上傳時指定時間戳?
從這些不同機器創建的文件在S3中具有時間戳。我們假設從任務節點提交的文件的時間戳在從主節點創建的文件之前。
我認爲這有時是不真實的,但爲什麼?
什麼時間戳分配給S3文件?它是亞馬遜EMR Hadoop客戶端還是一些S3機器?
如果我有兩臺機器上傳到本地時鐘相差30分鐘的S3,時間戳會相隔30分鐘嗎?
所以大概是一些S3服務器,但每個文件可能都不一樣。 – dfrankow
如果我理解你的評論權利,那麼是的。您無法控制您點擊的服務器或該服務器的精確時鐘值。 – sethwm