2017-01-25 95 views
0

我有一個像這樣的獨特平面文件。 ID和名稱由製表符分隔,而隨後的第二場已多逗號分隔值:從具有多個值的列中返回唯一匹配

ID1 \t name1,name2,name3 
ID2 \t name1,name1,name1,name4 
ID3 \t name1,name2,name2,name3 

我正在尋找一種方式來修整第二場讓每名只有每排一次出現。像這樣:

ID1 \t name1,name2,name3 
ID2 \t name1,name4 
ID3 \t name1,name2,name3 
+2

這似乎相當簡單。當你嘗試時出了什麼問題? – DSM

+0

你嘗試了什麼? – Inian

+0

我正在閱讀排序和uniq的人,因爲這些是我以前使用的,但無法找出使其工作的方式。 @ Trelzevir的解決方案非常好,我不知道爲什麼我沒有想到這個 –

回答

2

一旦你拿到了第二場,使用set()

set(["name1","name1","name1","name4"]) 

返回:

{'name1', 'name4'} 
+0

啊,謝謝!老實說,我不知道爲什麼我沒有想到這一點。 –