2012-04-04 79 views
1

我有一個python腳本來處理一個文件夾中的幾個文件時保存列表,結果是這樣的,是有兩列名爲USER_AGENT和USER_TYPE處理多個文件蟒蛇

firefox, pc 
IE, pc 
iPhone, mobile 
.... 

自來自相同或不同文件的結果可能會被複制,我使用一個列表來跟蹤唯一的組合。

if (user_agent,user_type) not in lookuplist: 
    lookuplist.append((user_agent,user_type)) 
    print user_agent,user_type 

現在的問題是,因爲我有一個以上的原始數據文件來分析,如何「拯救」 lookuplist當一個文件被完成,而第二個啓動時,它仍然知道,例如(火狐,PC)已經存在,那麼我不會有重複的結果

非常感謝

回答

0

首先,你應該使用set,而不是一個列表爲您lookuplist。其次,打開循環內的所有文件並在循環中檢查重複項。