2010-06-30 48 views
0

我有一個包含在一個包含大約30,000個子目錄的目錄中的數據集。這些目錄中的每一個都包含一個文本文件和另一個子目錄。該子目錄包含一些文本文件(範圍從0個文本文件到數百個)。我的許多同事都使用這個數據集,但實際上它至少需要6個小時才能將數據集從實驗室中的一臺計算機/硬盤傳輸到另一臺 - 不是因爲數據集的大小,而是因爲繁瑣它的存儲格式。我想創建一些存檔(如.tar.gz)來存儲這些數據,以便它們可以在計算機之間快速傳輸。我想看看有沒有人曾經使用過類似的東西,並能告訴我最快,最好的方法來做到這一點?我在想,一個shell腳本可能比我自己創建這個檔案更快。我需要製作一個包含幾個子目錄的大目錄

+0

運行Linux?你可能會有更多的運氣在superuser.com – 2010-06-30 18:33:51

回答

0

建議:NFS掛載目錄。然後,一個窗口框或一個unix框可以訪問該目錄。

評論:像這樣的目錄結構對文件系統中的inode是壞消息,並且也增加了搜索時間。

答:這將工作在任何POSIX兼容的Unix機器,並假定存在的只是一個基本目錄中repository--

cd /path/to/archive; tar cvf mycharhive.tar ./archive_dir; gzip myarchive.tar 

這將創建一個相對路徑tar歸檔 - 這意味着你可以將它解壓縮到一個低級目錄,而不是根目錄。

+0

真棒,謝謝 – WordWalk 2010-06-30 21:03:11

相關問題