Uniquifying列出的名單在python

到現在爲止，我已經在Python已經使用此代碼uniquify（刪除重複項）從名單：Uniquifying列出的名單在python

my_list = list(set(my_list))

我現在有一個列表的列表，我想能夠從列表清單中刪除重複項。例如：

(['possible-duplicate', 'random-data'], ['possible-duplicate', 'random-data'], ['possible-duplicate', 'random-data'])

我想刪除整個子列表，如果possible-duplicate是重複的。

可以這樣做嗎？

感謝

來源

2014-01-29 Daniel Pilch

你關心保持這種格式的數據嗎？因爲有一種方法可以將所有列表「扁平化」，以便無論列表列表中列出了多少個列表，它都會返回一個包含「同一級別」所有數據的列表，然後您可以使用該列表函數刪除重複項。雖然 – ZekeDroid

做一本字典，從您的數據：

data = (['possible-duplicate', '12345'], 
     ['not-a-duplicate', '54321'], 
     ['possible-duplicate', '51423']) 
data_unique = dict(data)

結果是{'not-a-duplicate': '54321', 'possible-duplicate': '51423'}，或者如果你喜歡一個元組列表，使用date_unique.items()，它給你[('not-a-duplicate', '54321'), ('possible-duplicate', '51423')]。

或爲更普遍的情況，其中子列表有兩個以上的元素，你可以使用這個

data_unique = dict((d[0], d) for d in data)

，然後用data_unique.values()收回「uniquified」名單。

來源

2014-01-29 20:43:36

假設每個子列表只有2個項目長... –

是的，假設問題是實際用例的代表。 –

@JoranBeasley增加了一般情況下的替代方案。現在好多了？ :-) –

seen = set() 

[sublist for sublist in my_list if sublist[0] not in seen and not seen.add(sublist[0])]

這種情況中保持秩序爲好，這list(set(...))沒有。

來源

2014-01-29 20:41:06 roippi

我不認爲使用理解副作用的if語句是值得推薦的。它不會增加可讀性和可維護性，但更多的是魔術。雖然這個答案用'and not seen.add（）'已經在SO上出現過不同的次數。 – Hyperboreus

Uniquifying列出的名單在python

回答

相關問題