我有很多文件,比如1000個文件,每個文件有4MB。完全有4GB。我想用UNIX排序對它們進行排序,這是我的命令:在做unix排序時儘量減少磁盤使用
sort -t ',' -k 1,1 -k 5,7 -k 22,22 -k 2,2r INPUT_UNSORTED_${current_time}.DAT -o INPUT_SORTED_${current_time}.DAT
其中INPUT_UNSORTED是通過附加1000個文件創建一個大的文件。所以還有另外4GB。 INPUT_SORTED也是另外4GB。
我發現unix排序使用臨時文件夾來排序文件,臨時文件也可能達到4gb。
如何在不損失性能的情況下減少磁盤使用量?
也許你不應該連續你的1000個文件,但給他們分別「排序」:http://stackoverflow.com/questions/3581215/in-unix-is-it-better-to-sort-multiple-small -files-or-one-big-file – Thilo