我是基於列1和列表3比較2大型未排序.csv
文件的任務。 每個文件包含大約200k條記錄。對於輸出,我需要知道基於第1列和第3列的記錄存在於第一個文件中,而不是第二個文件中。這些文件是用逗號分隔的值文件引用的。比較時,第3列需要忽略大小寫。比較2列基於2列的大型未排序CSV文件
例File1中:
"id", "name", "email", "country"
"1233", "jake", "[email protected]", "USA"
"2345", "alison", "[email protected]", "Canada"
"3456", "jacob", "[email protected]", "USA"
"5678", "natalia", "[email protected]", "USA"
文件2
"id", "name", "email", "country"
"2345", "alison", "[email protected]", "Canada"
"3456", "jacob", "[email protected]", "USA"
"5690", "lina", "[email protected]", "Canada"
期望的輸出文件
"5678", "natalia", "[email protected]", "USA"
代碼示例將是非常讚賞。
哪種語言,看你到目前爲止做了什麼問題呢? – Mark
爲什麼「'1233」,「jake」,「[email protected]」,「USA」'行不出現在輸出中? – brandizzi
嗨馬克,我嘗試了Java,使用HashMaps,它超級慢。 – Tanya