2011-04-27 38 views
1

Piwik是一種非常流行和常用的用PHP編寫的Web分析系統。它可以被看作是Google Analytics的替代品,並在有人訪問您的主頁時將所有類型的信息記錄到MySQL數據庫中。將Apache的access.log作爲Web分析系統的基礎Piwik

如果您考慮使用Piwik作爲您的新的主要使用的網絡分析軟件,則記錄過程從頭開始。這意味着,由於Piwik沒有收集到足夠的數據以便爲訪問者提供真實的概述,因此在安裝完畢後無法真正比​​較數據。記錄開始於您安裝Piwik時,這就是您必須等待的原因。

每個Apache網絡服務器都包含一個名爲access.log的文件,該文件會記錄每個對您的網絡服務器的訪問(如果激活)。有沒有辦法轉換這個文件或將其導入Piwik? access.log包含每個訪問者的IP地址,日期和時間,HTTP請求行,狀態碼和返回對象的大小。此外,它甚至會記錄引薦者和用戶代理。當然這不包括安裝的插件和顯示分辨率,但它仍然非常有用。

我有兩個問題:首先,在這種情況下轉換access.log是否合理?或者是否存在非Apache收集的非常重要的信息,但對於Piwik而言是必不可少的?其次,編寫這樣的轉換器是否容易,並且當某些信息丟失時不會混淆Piwik?

下圖爲Piwik的database schema

Piwik Database Schema http://dev.piwik.org/trac/browser/trunk/misc/db-schema.png?format=raw

可在表piwik_log_visit所有必填字段使用access.log文件,使Piwik將工作和顯示有關網站的有效信息填寫訪客?一個腳本如何將所有數據轉換爲數據庫並且PHP可以處理它(想想最長的執行時間)?正則表達式如何看起來像準備您的access.log轉換的任務?

+1

http://piwik.org/log-analytics/ – Tim 2012-08-23 08:55:28

回答

0

按這個票:http://dev.piwik.org/trac/ticket/703

描述說:「我知道這已經通過誰去很快就貢獻了代碼Piwik用戶來完成。」所以我希望看到它在實現未來Piwik。可以導入日誌,只有少數信息會丟失(分辨率,插件支持等)。