我正在使用HTML5文件API構建文件上傳器。我想確保沒有重複的文件上傳,根據他們包含的實際數據。這意味着即使兩個文件的名稱不同或者位於不同的文件夾中,也應將兩個文件視爲相同。在使用HTML5文件API上傳之前唯一標識文件
我已經考慮過使用md5計算散列,但是因爲這一切都必須在客戶端發生,所以使用javascript時,較大的文件將需要很長時間。當我說很大時,我的意思是高達5GB的視頻。
只是要清楚,這不必涉及校驗和,我只是想唯一識別文件。哈希可能是爲了這個目的的矯枉過正,但它是首先想到的。
更新:我想我需要一個輕量級的fingerprint算法。我發現Rabin作爲維基百科上的一個例子,但我不知道如何在JavaScript中實現這一點。
好問題,但哈希是唯一想到的東西。如果沒有檢查每個字節,您無法檢查文件是否是唯一的,因此最終無法避免瀏覽整個文件。 – JJJ 2013-03-22 11:02:22