3
對發佈這個有點猶豫 - 就我而言,這是一個真正的問題,但我想我會理解它是否被批評或關閉作爲討論邀請...在python中檢查大日誌文件
無論如何,我需要使用Python來搜索特定事件的一些相當大的Web日誌。正則表達式會很好,但我沒有被綁定到任何特定的方法 - 我只想要包含兩個字符串的行可以出現在GET請求中的任何地方。
由於典型的文件大小超過400mb,包含大約一百萬行,因此在完成和加載服務器的時間(ubuntu/nginx VM - 相當好的spec'd和很少過度工作)方面的性能很可能是的問題。
我是一個相當新的轉換到Python(注意相當新手,但仍然有大量的學習),我想的最佳方式有點指導來實現這一
難道我打開和遍歷? grep到一個新的文件,然後打開? 兩者的一些組合? 還有別的嗎?
http://www.youtube.com/watch?v=ZOpR3P-jAno – root 2013-04-24 07:46:29
有在PYCON 2013一個偉大的演示文稿標題爲['服務器日誌分析與熊貓'](http://pyvideo.org/video/1745/server-log-analysis-with-pandas-0)應該是一個很好的起點。 – 2013-04-24 07:46:53
@BurhanKhalid :) – root 2013-04-24 07:47:12