我正在研究與重複數據刪除相關的項目。我需要設計一個指紋計算模塊(用來計算文件塊的指紋),它將接受兩個輸入並給出一個輸出。在python中計算(unsigned char *)的SHA1指紋
輸入:some_module(unsigned char*buffer, uint32 buffer_length)
輸出:unsigned char* fingerprint
我被要求設計一個類來實現模塊上方。我將使用hashlib
但我的問題是如何選擇適當的數據類型在Python中執行此操作?
我正在研究與重複數據刪除相關的項目。我需要設計一個指紋計算模塊(用來計算文件塊的指紋),它將接受兩個輸入並給出一個輸出。在python中計算(unsigned char *)的SHA1指紋
輸入:some_module(unsigned char*buffer, uint32 buffer_length)
輸出:unsigned char* fingerprint
我被要求設計一個類來實現模塊上方。我將使用hashlib
但我的問題是如何選擇適當的數據類型在Python中執行此操作?
如何在Python中選擇正確的數據類型?
您可以在輸入和輸出中使用Python字符串(str
)。
如果這樣做,您將可以直接使用hashlib.sha1()
,而不需要任何數據類型轉換。
那麼這清除了我的懷疑。我有另一個問題。計算指紋時緩衝物質的長度是多少? – Heisenberg
確實如此,但'str'會記錄它的長度。 – NPE
Python不做靜態類型檢查。所以不要擔心,但是關於DEA:p – thefourtheye
@thefourtheye爲什麼您在這裏必須擔心[** DEA **](http://en.wikipedia.org/wiki/Drug_Enforcement_Administration)? –
@KDawG Breaking Bad的主角名叫Heisenberg .. :) – thefourtheye