我使用RAR實用程序(100GB未壓縮,20GB壓縮)獲得了一個大的多部分壓縮CSV文件,因此我有100個RAR文件部分已上傳到Google雲端存儲。我需要將其提取到Google雲端存儲。如果我可以在GAE上使用Python,那將是最好的。有任何想法嗎?我不想下載,提取和上傳。我想在雲端做所有事情。從Google雲端存儲中提取RAR文件
4
A
回答
4
無法直接解壓縮/提取雲中的RAR文件。你知道gsutil -m
(多線程/多處理)選項嗎?它通過並行運行來加速傳輸。我建議這個順序:使用gsutil -m cp file-pattern dest-bucket
除非你有一個非常緩慢的互聯網連接
- 下載壓縮歸檔文件
- 本地解壓
- 上傳並行解包文件,20GB不應該需要很長的時間(我預計不到一個小時),同樣也需要並行上傳(儘管這是您獲得多少並行性的功能,而這又取決於存檔文件的大小)。
順便說一句,你可以通過
parallel_thread_count
和parallel_process_count
變量在$HOME/.boto
文件中調整gsutil -m
使用的並行度。
6
這個問題已經得到了回答(並且被接受),但是對於未來的類似用例,我會建議在GCE上完成一個小的Linux實例,例如f1-micro
,然後將步驟作爲由Marc Cohen在his answer中建議。這些實例預裝了gsutil
,因此很容易使用。完成後,請關閉並刪除微型實例,因爲結果文件已存儲在Google雲端存儲中。
步驟一步的說明:
說明這樣做的好處是,不是下載到自己的電腦,你我們會將所有數據傳輸到Google Cloud本身,因此傳輸速度應該非常快,並且不依賴於您自己的Interne t連接速度或消耗您的任何帶寬。
注:網絡帶寬正比於VM(在的vCPU),所以對於更快的性能,考慮創建更大的VM的大小。谷歌計算引擎pricing for VM instances如下:
- 至少10分鐘
- 向上舍入到最接近的分鐘
因此,舉例來說,假設一個n1-standard-1
收費USD $ 0.05 /小時(如8 2016年10月),15分鐘的使用費用共計0.0125美元。
相關問題
- 1. 使用XLRD從Google雲端存儲中讀取文件(python)
- 2. 如何從Google雲端存儲中讀取大文件(〜300 MB)?
- 3. 從Google雲端存儲桶中讀取JSON文件內容
- 4. 從App Engine上的Google雲端存儲中讀取文件
- 5. 從Google雲端存儲服務器提供HTML文件
- 6. 從Google雲端存儲中存儲的XLS中讀取數據
- 7. 從其BlobKey獲取Google雲端存儲文件
- 8. 上傳文件到Google雲端存儲
- 9. 從Google App Engine上傳文件到Google雲端存儲(Java)
- 10. 從Google雲端存儲中恢復大容量文件
- 11. 從Google雲端存儲中下載多個文件(使用node.js)
- 12. 使用Google App Engine從Google雲端硬盤或雲端存儲中讀取和寫入大型文件
- 13. Python App引擎爲Google雲端存儲提供文件
- 14. 「jQuery」「Google雲端存儲」
- 15. Google雲端存儲傳播
- 16. 在Android應用程序中從Google雲端存儲中讀取文件
- 17. Google雲端存儲 - 按文件中的值拆分文件
- 18. Git使用Google雲端存儲的大型文件存儲
- 19. Google App Engine:從Google雲端存儲讀取
- 20. Google雲端存儲文檔縮略圖?
- 21. 壓縮保存在Google雲端存儲中的文件
- 22. 使用Python從Google雲端存儲下載大文件
- 23. 從Android將文件存儲到Google雲端?
- 24. 通過PHP從Google雲端存儲下載文件
- 25. 試圖將文件從網頁上傳到Google雲端存儲
- 26. 從Google雲端存儲桶下載文件夾
- 27. 從.Net上傳文件到Google雲端存儲
- 28. 將文件從Dropbox/Drive傳輸到Google雲端存儲
- 29. 將Google雲端存儲中的文件添加到雲端硬盤
- 30. 從Google雲端存儲中獲取較短的文件URL(使用Firebase雲端功能)
你能否詳細說明如何做到這一點? –
@Soren - 我編輯了答案,以添加分步說明,希望這有助於。 –