如何將包含潛在數百萬個文件的超大目錄拆分爲一些自定義最大數量的文件的較小目錄,例如每個目錄100個,在UNIX上?單行將Unix上的超大目錄拆分爲更小的目錄
獎勵積分,如果你知道的方式有wget
自動下載文件到這些子目錄。因此,如果有100萬.html
頁處www.example.com
頂層路徑,如
/1.html
/2.html
...
/1000000.html
,我們只希望每個目錄100個文件,將它們下載到的文件夾類似
./www.example.com/1-100/1.html
...
./www.example.com/999901-1000000/1000000.html
只有真正需要在wget
下載文件後才能在文件夾上運行UNIX命令,但是如果可以在wget
下載文件時執行此操作,我很想知道!
文件名中是否需要逗號?他們會讓解決方案變得更加複雜。 –
不一定,但下載的文件在技術上可以包含任何內容(其中很多包含逗號,以及這些字符:'?,:; /%{} [] $&*^@!〜'')。 –
好吧,現在我很困惑......如果你的文件名包含一堆特殊字符,你將如何創建目錄名?在你的例子中,這些目錄包含一系列數字......文件名是格式爲「{name-including-special-characters} {number} .html'? –