2017-10-11 36 views
1

我決定嘗試使用Google Cloud Datalab處理我正在處理的小型項目,而不是AWS實例上Anaconda環境中的Jupyter Notebook。Datalab - 如何安裝並保留包

如何在Datalab VM上安裝軟件包(例如OpenCV),以便每次重新啓動VM時都不必重新安裝軟件包?爲什麼每次重新啓動後程序包都會消失,但更新的筆記本電腦仍然保持不變?回答這些問題並闡明Datalab VM工作原理的任何幫助都會非常有幫助。

回答

2

筆記本電腦存儲在碼頭卷裝載中,該裝載碼錶示永久性磁盤上的位置,該位置在重新啓動VM時進行維護。

但是,您安裝的軟件包存儲在正在運行的容器中,因此在每次重新啓動時都會丟失。

您可以創建自定義泊塢窗圖像並使用它。在datalab create命令中,請參閱--image-name參數。

這裏是一個Dockerfile的例子,你需要使用:

FROM gcr.io/cloud-datalab/datalab:latest 
RUN pip install opencv 

請注意,你需要建立使用該碼頭工人文件泊塢窗圖像,並將圖像推到谷歌集裝箱登記。我的記憶對此有些模糊,但可能需要將此圖像標記爲公開。

希望有幫助!

+1

謝謝,Nikhil!這就是說,我很努力地看到使用Datalab的好處,而不是在計算引擎虛擬機上安裝Conda,並在那裏運行Jupyter筆記本電腦。這樣我就可以輕鬆地安裝新軟件包並讓它們永久保持在實例上。我仍然不明白爲什麼我要在這種情況下使用Datalab?我閱讀了文檔,但這仍然不清楚。 – haroon7