語言: vb.net 文件大小:1GB和東西。如何確保文件在vb.net中具有唯一的行如果文件的大小非常大
文本文件的編碼: UTF8(因此每個字符由不同數量的字節表示)。
整理: UnicodeCI(當幾個字符基本相同時,最流行的版本將是唯一的版本。)。我想我知道如何處理他的問題。
由於每個字符都由不同數量的字節表示,並且每行的字符數不同,因此每行中的字節數也各不相同。
我想我們必須爲每一行計算哈希。我們還需要將緩衝區的位置存儲在每行的位置。然後我們必須比較緩衝區。然後我們將檢查是否顯示同一行。
是否有最適合此功能的特殊功能?
什麼是MD5的大小?一個不完美的方法是使用壓縮內存的整數散列。但是再次,幾條不同的線必須具有相同的散列。這就是爲什麼我們也需要存儲緩衝區位置。 – 2012-04-04 04:46:14
+1我也大量修改了你的代碼。該退出雖然是一個bug,等等。 – 2012-04-04 05:57:54
sr.BaseStream.Position
2012-04-04 06:40:02