設置（）不刪除重複

我想在使用正則表達式的文件中找到IP地址的唯一實例。我覺得他們很好，並嘗試追加到列表中，然後嘗試在我的列表中使用set()刪除重複項。我發現每個項目都可以，並且有重複的內容，但是我無法獲得簡化的列表。打印我的設置的輸出與打印ips作爲列表相同，不會刪除任何內容。設置（）不刪除重複

ips = [] # make a list 
count = 0 
count1 = 0 
for line in f: #loop through file line by line 
    match = re.search("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}", line) #find IPs 
    if match: #if there's a match append and keep track of the total number of Ips 
     ips.append(match) #append to list 
     count = count + 1 
ipset = set(ips) 
print(ipset, count)

此字符串<_sre.SRE_Match object; span=(0, 13), match='137.43.92.119'>顯示了60+次在輸出之前，並試圖set()列表

來源

2016-04-20 BitFlow

語法correct..maybe你需要檢查'ips' – rock321987

你正在做一組*比賽對象*。 – user2357112

@ rock321987如果我同時打印 – BitFlow

你是不是存儲匹配的字符串之後。您正在存儲re.Match objects。這些不比較相等時，即使它們匹配的相同的文字，所以他們都是由一個set對象看作是唯一的：

>>> import re 
>>> line = '137.43.92.119\n' 
>>> match1 = re.search("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}", line) 
>>> match1 
<_sre.SRE_Match object; span=(0, 13), match='137.43.92.119'> 
>>> match2 = re.search("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}", line) 
>>> match2 
<_sre.SRE_Match object; span=(0, 13), match='137.43.92.119'> 
>>> match1 == match2 
False

提取，而不是匹配的文本：

ips.append(match.group()) #append to list

matchobj.group()不帶參數的回報字符串這是相匹配的部分（組0）：

>>> match1.group() 
'137.43.92.119' 
>>> match1.group() == match2.group() 
True

來源

2016-04-20 17:13:26

我試圖接受答案，但還不能。清除它，非常感謝！ – BitFlow

設置（）不刪除重複

回答

相關問題