許多常見文件系統不提供原子操作,但在特定情況下以原子方式寫入文件非常重要。我試圖想出解決這個問題的辦法。在非事務性文件系統中實現原子文件寫入
我做出以下假設:
- 在使用文件系統支持原子操作在inode的水平(例如NTFS)。這意味着移動和刪除是原子。
- 只有程序本身訪問文件。
- 程序一次只有一個實例,它以單線程方式運行。
- 爲簡單起見,每次寫入整個文件內容(即截斷 - 寫入)。
這會導致以下問題:寫入文件時,程序可能會被中斷,文件只剩下一部分內容來寫入。
我提出以下過程:
- 寫新的內容到一個臨時文件新
- 移動原始文件原始到一個臨時位置備份
- 移動新到原創
- 刪除備份
新和備份文件是從原始文件區分(例如,它們可以被不同的前綴,或者可能是在同一個捲上一個單獨的目錄)。同時,他們的名字應直接映射到相應的原始(例如通過簡單地使用相同的文件名)。
但是,這並不會使操作原子化。該過程可以被中斷的步驟1,2,3或4:
- 葉一個不完整的潛在的新。
- 移動是原子的,但目標文件現在丟失。 新和備份存在和完成。
- 移動是原子的,但有一個未使用的備份。 原始被替換爲新內容
- 刪除是原子性的。
使用前面的假設2和3,程序必須在崩潰後重新啓動。在啓動過程中,應該執行這些恢復檢查:
- 如果新存在,但備份不,我們還是第1步後墜毀刪除新,因爲它可能是不完整的。
- 如果新存在,備份確實太少,我們墜毀步驟2後,繼續執行步驟3.
- 如果備份存在但新沒有,我們也墜毀後繼續執行步驟3與步驟4.
恢復過程本身,只使用原子操作,將簡單地繼續它中斷後停止的地方。
我相信這個想法可以確保單個程序的原子寫入。這些問題仍然存在:
- 當使用同一程序的多個實例時,恢復過程與當前正在進行的其他程序中的文件寫入存在干擾。
- 僅讀取但從不寫入的外部程序通常會得到正確的結果,但如果在請求的條目上同時存在寫入操作,則它們可能會錯誤地未找到條目。
可以通過使用策略(例如,檢查其他實例,並拒絕其他用戶的目錄訪問)來解決這些問題(以前被假設排除)。
最後,我的問題:這是否有道理,或者是否有缺陷?是否有任何問題阻止這種方法在實踐中被使用?
我爲此寫了一些C#代碼,我可以根據要求添加它,但問題已經有一英里長了。 – mafu 2012-02-01 13:17:51