0
我需要爲存儲在Linux網絡共享中的文件生成統計信息,並希望能夠在網絡共享上本地運行shell腳本或程序以生成數據點以下屬性:統計Linux服務器上的文件夾和文件結構
path(or relativepath)|文件名|文件大小| datecreated | datechanged | dateaccessed
大約有一百萬到一百萬個文件(8TB),我想探索數據集以掌握文件類型的組織和平衡(由文件名和路徑的組合決定)到文件總數和存儲總量。
問題:
什麼是遍歷文件系統,並得到該數據的有效方法是什麼?
什麼樣的數據庫,你會推薦探索這種數據與層次結構中不同層次的統計數據?
你期待什麼樣的查詢能夠用這個數據庫來回答? – Joni
查詢的有用結果:從根開始的3個級別的文件夾樹結構。每個文件夾的文件數量和總大小。文件夾子樹內的所有數據點。 – wna
我計劃添加屬性到數據點,同時探索不同級別的大小,文件名和年齡分佈。 – wna