0
在Python pandas
,我可以很容易地下降重複與數據幀:C#deedle相當於熊貓df.drop_duplicates?
df1.drop_duplicates(['Service Date', 'Customer Number'], inplace=True)
有沒有在C#中的任何或Deedle
這是這個簡單而快速的?或者我需要遍歷整個框架(從一個大的CSV文件),以刪除重複?
我正在使用的數據是從大約40列和12k行的大型CSV文件導入的。對於每個日期,客戶編號都有多個條目。我需要消除每個日期重複的客戶編號行(只留下一個唯一的)。
下面是一些簡單的數據,使用日期和RECN如用於去dupify列:
NAME, TYPE, DATE, RECN, COMM
Kermit, Frog, 06/30/14, 1, 1test
Kermit, Frog, 06/30/14, 1, 2test
Ms. Piggy, Pig, 07/01/14, 2, 1test
Fozzy, Bear, 06/29/14, 3, 1test
Kermit, Frog, 07/02/14, 1, 3test
Kermit, Frog, 07/02/14, 1, 4test
Kermit, Frog, 07/02/14, 1, 5test
Ms. Piggy, Pig, 07/02/14, 2, 3test
Fozzy, Bear, 07/02/14, 3, 2test
Ms. Piggy, Pig, 07/02/14, 2, 2test
你還需要排序嗎? – terrybozzio
添加了一些簡化的數據。它實際上已經按原樣排序,在真實數據中,排序並不會受到影響(上面的測試數據沒有排序)。 – user3478193