我有一個csv文件,其中第一列包含標識符和第二列關聯數據。標識符被複制任意次數,所以文件看起來像這樣。
data1,123
data1,345
data1,432
data2,654
data2,431
data3,947
data3,673在python或numpy中合併記錄
我想合併的記錄產生單記錄每個標識符並獲取。
data1,123,345,432
data2,654,431
data3,947,673
是否有一個有效的方式Python或numpy的做到這一點?字典由於重複的鍵而顯示出來。目前,我在列表中列出了行,然後循環並測試列表中索引爲0的前一個值的身份,但這非常笨拙。謝謝你的幫助。
「字典似乎是出因重複鍵」我不知道我明白爲什麼這是一個問題。具有值列表的字典是否不起作用?就像在你的例子中一樣,用'{'data1':[123,345,432],'data2':[654,431],'data3':[947,673] }' – 2012-01-27 00:48:25