我有成千上萬個主要以編程方式訪問的pdf文件。他們的學術文件,他們的名字開始<the last name of the author in letter><optional digit(s) to distinguish different authors of the same name><period><year><optional letter(s) to distinguish different documents of the same author-year>
)是這樣的:將大量文件分割成子目錄
Johns1.2000a.pdf
但從編程相關方案的角度來看,這是比較容易,如果所有這些文件都在一個目錄。
但是,當我偶爾在GUI文件瀏覽器上手動打開這些文件時,目錄太大以致文件瀏覽器的響應變慢。因此,我將文件分隔成以文件名的首字母命名的子目錄(即文件Johns....pdf
進入子目錄J
等)。但
- 我不知道是否有意義要做到這一點,
,也有使用這種方法的問題。
- 首先,文件名相對於首字母不均勻分佈;一些字母有更多的文件開始與一些少。
- 其次,如果文件的集合增長,每個子目錄會變得太大了,我會去到像
AA
,AB
另一個層面上,...,這- 是任意和特設(我會每當我感覺子目錄變得太大時必須手動添加一個級別),並且不均衡分配會變得更糟(例如,目錄
QQ
中幾乎沒有任何文件,但是在KA
中相當多) 。
- 是任意和特設(我會每當我感覺子目錄變得太大時必須手動添加一個級別),並且不均衡分配會變得更糟(例如,目錄
在這種情況下,
- 這有什麼意義,使子目錄呢?我只是偶爾手動訪問文件,所以我可以忍受文件瀏覽器的慢速響應。從其他角度來看,有沒有這樣做的優點?
- 如果創建索引是有意義的,那麼有沒有一種方法不存在上述問題?
這大多解決了分佈不均勻的問題(如果過程可以自動化,則會產生聲響)。 (次要)問題是它不能直觀地手動訪問。但也許我期待太多。 – sawa
在您實施解決方案後,我很樂意在將來看到該問題的更新。 –