2014-10-08 32 views
0

我需要比較應該相同但可能不相同的兩組RRD文件(幾百萬)。如何儘可能快地掃描它們?它足以讓我通過如何快速掃描許多RRD文件

rrdtool info 

命令獲取生產信息。目前在我的磁盤上,此操作需要一天的時間。

更新:
我用Python開發。可能採用RRD二進制文件的前幾個結構併爲其生成MD5SUM可能會縮小我需要與rrdtool信息完全比較的文件數量。問題是如何找到從文件中讀取多少字節以使檢查有價值。

回答

0

看看rrd_format.h ...關於rrd文件結構的有趣的部分都在文件的開頭。

使用rrdtool信息的python綁定而不是調用命令(如果你還沒有這樣做)應該加快速度。另一方面,如果您有兩個rrd文件,它們使用相同的參數創建,但隨後使用不同的值進行更新,但仍可能具有相同的標題。因此,只是比較標題可能會引起誤解,除非您沒有提及您擁有的其他信息,例如獨特的DS名稱或類似的名稱。