2012-09-22 65 views
0

我試圖通過R來分析weblog文件。我很樂意處理日期和字節,無論數字數據存在但無法處理字符串。R的Apache日誌文件格式分析

從日誌文件(登錄CSV格式文件),我想找出特定用戶(IP和代理的幫助下)及其在網頁上的總支出。

+0

它看起來像你希望別人爲你做的工作。你到目前爲止嘗試了什麼? – dickoa

+0

可能的重複[R中的日誌文件分析](http://stackoverflow.com/questions/5664997/logfile-analysis-in-r) –

+0

@dickoa:無論我做了什麼工作,我都試圖把這個快照它在這裏,但最近的成員沒有資格把我得到的瞬間,當我試圖分享它...... – furianpandit

回答

1

有numurous庫做這種分析的,雖然我能找到沒有在R.阿谷歌爲parse apache logfile產生a library in Perlpython parse apache logfile產生了Scratchy library。兩者都依賴於regular expressions解析文件的內容。

從這裏有兩種方法來處理apache的日誌文件:來自R

  • 呼叫Perl或Python,或者使用直接連接,或使用系統調用(這是簡單)。
  • 採取從Perl或Python的lib的想法,並用它來實現的功能的R版本中。這將花費很多時間。

你指的csv文件,但我認爲上面與Apache日誌的原始文本文件的工作庫,所以我會用這些,而不是你的csv文件。

此外,this SO post他說,他已經創造了一些函數來創建日誌文件Apache的數據,被Python解析的可視化提到由@doug(profile)的答案。也許你可以給他發送消息或郵件,看看他是否願意分享代碼。 R中

0

日誌文件分析是一個有趣的話題,我們已收到,你可以找到我們的討論權here。也許這個討論還可以幫助你調整到SO禮儀,以獲得更好的反饋(不是從你的,保羅帶走什麼)。

+0

感謝您的額外信息,鏈接已經在我的答案btw。 –

+0

哎。對不起,保羅... –