2014-04-08 99 views
0

我正在創建一個python腳本來分析日誌文件(例如:http://www.monitorware.com/en/logsamples/apache.php),並且需要我可以用來實現此目的的方法建議。Python腳本分析日誌文件

  1. open方法讀取日誌文件。好。
  2. 計算日誌的已用時間?我使用哪種方法從日誌行中的特定位置讀取?例如:64.242.88.10 - - [07/Mar/2004:16:05:49 -0800] "GET /twiki/bin/edit/Main/Double_bounce_sender?topicparent=Main.ConfigurationVariables HTTP/1.1" 401 12846 在這種情況下,如何計算像年份這樣的特定位置之後的經過時間?

    我還需要顯示每分鐘發送的請求數,發送的數據總量,發送的平均數據量,單個請求發送的最大數據量。
+0

請向我們展示您已經嘗試過的代碼。描述哪些是有效的,哪些不起作用。 –

回答

1

我想用re模塊從文本(搜索,substr等)中提取信息。

然後strptime可能是您的朋友將這些日期時間值轉換爲日期時間並對它們進行計算。

之後,我會使用numpy.ndarray來存儲數據並生成進一步的報告。

我也喜歡matplotlib和功能如hist做出一些不錯的情節。