1
我在google雲端datalab上運行a notebook。它生成一些中間輸出文件。運行筆記本時會顯示文件。寫入磁盤的文件在一段時間後被刪除
但幾個小時後,當我再次打開筆記本電腦時,只有datalab git存儲庫(主要是筆記本文件)中的文件存在,其他所有內容都被刪除。筆記本內核似乎也重新啓動。
有什麼理由?我該如何避免這種情況?
我在google雲端datalab上運行a notebook。它生成一些中間輸出文件。運行筆記本時會顯示文件。寫入磁盤的文件在一段時間後被刪除
但幾個小時後,當我再次打開筆記本電腦時,只有datalab git存儲庫(主要是筆記本文件)中的文件存在,其他所有內容都被刪除。筆記本內核似乎也重新啓動。
有什麼理由?我該如何避免這種情況?
Google Cloud Datalab在App Engine Managed VM Environment上運行。這些使用ephemeral disks不保存重新啓動之間的數據。
如果中間輸出文件需要保留以備將來使用或遵從性原因,則應使用Google Cloud Storage或其他durable mechanism來保存它們。
虛擬機實例內部的存儲只適用於臨時的一次性數據。
一個相關的問題探討持久磁盤的使用情況:Using persistent disks with google Datalab
所以IIUC,如果我安裝額外的Python模塊也不會持續,我需要每次重新安裝模塊。 – Choghazanbil
我需要時重新運行'%% bash pip install x'。 Datalab目前處於測試階段,所以我希望這會得到改善。 –