2
A
回答
2
使用散列。他們是重複數據刪除數據的典型方式:
my %data;
while (<$fh>) {
.... # other code
$data{$key} //= $value;
}
的定義,或賦值運算符//=
是做等價的:
if (not defined $data{$key}) {
$data{$key} = $value;
}
這意味着只有這關鍵的第一個值被保存。
請注意,帶散列的重複數據刪除僅適用於完全相同的字符串。
0
使用散列來跟蹤您已經看到的行。
my %seen;
while (<$fh>) {
next if $seen{$_}++; # duplicate
...
}
相關問題
- 1. 選擇首次出現唯一列集合的所有行
- 2. Stata:首次出現次數,變量唯一出現次數總和
- 3. node-orm2獲取唯一出現次數?
- 4. 首次出現
- 5. 解析詞的首次出現未用空白
- 6. 查詢以獲取具有唯一對象的行解析ios
- 7. 解析與Python中的文件,以獲得一個CSV
- 8. Android - 首次運行時解析文件時需要的一般建議
- 9. 蟒蛇的findall唯一一次出現
- 10. 解析JSON並不首次
- 11. 如何從一個文件中唯一出現次數在linux
- 12. 解析PDF在同一頁獲得兩次相同的文本
- 13. HTML DOM解析 - 我可以找到唯一的文件類型?
- 14. 解析XML文件,以獲得特定的文本內容
- 15. JSON解析,以獲得值
- 16. 列上的dplyr唯一出現次數
- 17. 計數唯一的出現次數PowerPivot
- 18. R(計數唯一的出現次數)
- 19. 解析/迭代HTML源代碼來獲得與wget的唯一
- 20. 你如何捕獲的R首次出現[和最後一次出現]之間的文本
- 21. Mysql的選擇唯一行(僅出現一次)
- 22. AppleScript的獲得一個文件夾的唯一文件名
- 23. 保持N首次出現
- 24. Hpricot/nokogiri - 解析SVG/XML文件以獲得使用的顏色
- 25. SQL:計算唯一出現次數?
- 26. 解析重複+ d的一次出現在一條線上
- 27. 得到文件第N行解析另一個文件
- 28. 解析PDF文件時出現問題
- 29. 解析json文件時出現問題
- 30. 解析JSON文件時出現undefined
對於文件大小大於1 GB的文件,Hash能夠有效地工作嗎? – david
@david - 有足夠的記憶,是的。如有必要,將文件拆分成更小的部分,在每個部分找到唯一的行,然後在合併時重複數據刪除。 – 2013-06-05 15:07:05
我其實不需要鑰匙。有沒有辦法避開鑰匙? – david