2017-05-06 28 views
-1

我想分析一個apache訪問日誌文件,並設法使用正則表達式來分解我感興趣的部分。我正在嘗試查找日誌中唯一IP的數量(僅限主機)。Python - 查找唯一的組發生(正則表達式)。

 for line in log.splitlines(): 
      result = pattern.match(line) 
      IPs = list(result.groups()[0]) 
      print len(set(IPs)) 

在這一點上,我很迷茫。我似乎無法獲取IP地址,我可以使用len()來獲取大小和設置(IP)來擺脫重複出現的IP。我意識到上面的代碼是錯誤的。有什麼建議麼?

+0

日誌看起來像什麼?什麼是'模式'?你得到什麼而不是你想要的結果?有沒有錯誤信息? – mkrieger1

回答

0

解決!我逐行瀏覽文件,使用我的模式抓取IP並將它們添加到之前聲明的大型列表中。然後在循環結尾使用len(set(IPs))。