我試圖從github url中讀取日誌文件,使用IP作爲查找鍵添加一些地理信息,然後將一些日誌信息和地理信息寫入文件。我已經從日誌中讀取和寫入文件,但我不確定使用什麼庫來查找IP地址的座標等,也不知道如何真正瞭解這部分內容。我找到了正則表達式模塊,當我開始理解它時,我發現它已被棄用。這就是我所得到的,任何幫助都會很棒。使用Python解析Apache日誌2.7
import urllib2
apacheLog = 'https://raw.githubusercontent.com/myAccessLog.log'
data = urllib2.urlopen(apacheLog)
for line in data:
with open('C:\LogCopy.txt','a') as f:
f.write(line)
所以,你現在試圖解析「C:\ LogCopy.txt」?顯示你有什麼*嘗試*。 – 2015-02-07 19:27:13
我正在從github上的文件寫入C:\ LogCopy.txt。操作將在我寫入LogCopy之前發生。我不知道用什麼來排隊,除了一些凌亂的切片,也許。它看起來像文件是通用日誌格式,我認爲我可以使用%x來拉出部分,但我不知道這只是用於正則表達式或什麼。我只是不知道從哪裏開始。我並不是在尋求答案,只是朝着正確的方向前進。 – RagePwn 2015-02-07 19:39:48
不知道你期望的輸出是相當不得不給出任何合理的答案,有一個你可以使用的重新模塊。 – 2015-02-07 19:47:57