如何從元組列表中刪除重複項，但保留原始順序

我想刪除冗餘元組，但保留外觀順序。我看了類似的問題。這個問題Find unique rows in numpy.array看起來很有希望，但不知何故，它不適合我。如何從元組列表中刪除重複項，但保留原始順序

我可以在這個答案中使用熊貓（https://stackoverflow.com/a/14089586/566035），但我不喜歡使用熊貓，因此py2exe生成的可執行文件很小。

import numpy as np 

data = [('a','z'), ('a','z'), ('a','z'), ('1','z'), ('e','z'), ('c','z')] 

#What I want is: 
    array([['a', 'z'], 
      ['1', 'z'], 
      ['e', 'z'], 
      ['c', 'z']], 
      dtype='|S1') 

#What I have tried: 
# (1) numpy.unique, order not preserved 
np.unique(data) 

    array([['a', 'z'], 
      ['c', 'z'], 
      ['1', 'z'], 
      ['e', 'z']], 
      dtype='|S1') 

# (2) python set, order not preserved 
set(data) 

    set([('1', 'z'), ('a', 'z'), ('c', 'z'), ('e', 'z')]) 

# (3) answer here : https://stackoverflow.com/a/16973510/566035, order not preserved 
a = np.array(data) 
b = np.ascontiguousarray(a).view(np.dtype((np.void, a.dtype.itemsize * a.shape[1]))) 
_, idx = np.unique(b, return_index=True) 

a[idx] 

    array([['1', 'z'], 
      ['a', 'z'], 
      ['c', 'z'], 
      ['e', 'z']], 
      dtype='|S1')

來源

2014-09-03 otterb

這不是在效率方面很好，但是很簡單，可讀的代碼，可以爲較小的列表工作：

sorted(set(data), key=data.index)

來源

2014-09-03 18:03:22 Saish

哇。這也很好。謝謝！ – otterb 2014-09-03 18:21:54

很難挑選答案，但我認爲我更喜歡這個。感謝大家！ – otterb 2014-09-03 18:57:30

哇 - 這種排序和索引操作的開銷是驚人的...我不會說它「效率不高」 - 我會說它真的很差:( – 2014-09-03 23:05:03

哎呀！我找到了答案自己...

seen = set() 
np.array([x for x in data if x not in seen and not seen.add(x)]) 

# output 
array([['a', 'z'], 
     ['1', 'z'], 
     ['e', 'z'], 
     ['c', 'z']], 
     dtype='|S1')

來源

2014-09-03 17:40:29 otterb

我永遠不會有被認爲使用'而不是'來強制返回'None'的調用。偷偷摸摸的！ – 2014-09-03 18:31:15

是的，棘手。這是我在很久以前在stackoverflow中找到的地方。但我不記得在哪裏。 – otterb 2014-09-03 18:51:08

如何從元組列表中刪除重複項，但保留原始順序

回答

相關問題