2013-05-25 88 views
1

我想保留一些關於某些網頁的基本信息。DIY網站統計/分析

我希望保留的信息非常少,而Google分析的內容過於誇張,並且很難將結果集成到頁面中。

我想保留時間戳,IP和瀏覽器信息來計算每天/每週/每月/每年的訪問次數的準確信息,並且能夠了解訪問者來自哪裏。

將此信息存儲在所有頁面的平面文件,每頁跟蹤的平面文件或關係數據庫中是否更好?

+0

我傾向於每頁/平面文件,因爲編寫和檢索信息可能是最快的,並且不會膨脹我正在使用的數據庫。 – Daniel

回答

1

當你說「將結果集成到頁面中」時,我有些困惑。你想以某種方式公開顯示你的流量,或者你只是想要一個用戶友好和簡單的界面來看待事情嗎?

當您說「將所有信息保存在平面文件中是否更好,每頁平面文件跟蹤或關係數據庫? - 這也讓我感到困惑,如果你有cPanel或大多數其他類型的服務器,它已經自動存儲每個用戶與服務器/網站交互的日誌文件。日誌文件是「所有頁面的平面文件」+用戶所做的任何其他內容。真的,無論你獲得多少流量,服務器都會將其記錄到一個文件中。沒有太多需要進入數據庫,除非你正在做其他的事情。我覆蓋選項B中的日誌文件。

我試圖衡量您的專業知識,但我只列出我通常做事情的方式。也許會有幫助。

選項A是一個網站的一個相當新的用戶/管理員(但可能適合你完美)&

選項B是一個誰更先進一點,但會顯示信息你想在一個不錯的Excel電子表格格式化。它還需要更多的步驟。每個人都不瞭解你的專業水平,我會詳細討論。如果它是多餘的道歉。

選項A) Statcounter.com - 它非常容易安裝,免費,沒有CC預付費,涵蓋了您似乎需要的一切,並且可擴展。即使你不知道如何將代碼複製並粘貼到頁面中,他們也有一個很好的簡單指南。這對一定數量的遊客是免費的(我相信他們會持有最近的250),那麼你只需支付一小筆費用。我相信每年的費用大約是10美元,可以記錄最近5000個訪問者的日誌,並且非常合理地從那裏上升。

您也可以只將它放在選定的頁面上,就像您似乎想要做的那樣。

Statcounter將收集的不僅僅是時間戳,IP,瀏覽器信息和引薦網址,還有更多關於您感覺像谷歌分析一樣被淹沒的點 - 它可能完全適合您的需求。用戶界面也非常友好。

選項B)更準確的方法,需要多一點經驗/努力將是下載您的服務器日誌。這可能對你沒有任何用處,但是這裏有用。

我不確定你有什麼類型的網站或服務器,但如果是cPanel,你應該在cPanel的主頁面上看到引用「日誌」的內容。如果它不是cPanel,我不確定在哪裏找到他們說實話,嘿 - 但他們會在某個地方。

使用cPanel,一旦您單擊「服務器日誌」或「包括單詞日誌的同義短語」按鈕,您應該可以從服務器下載原始日誌。它可以用一種你可能不熟悉的文件類型,例如「.tar.gz」,以一種奇怪的方式吐出它們。這只是一個zip格式的文件,您需要「7-Zip」(搜索Google並下載它)才能打開。您不一定需要提取文件,只需用7-Zip在Windows中打開文件並打開文件夾層,直到找到可能以「.com」結尾的文件。

右鍵單擊它並從7-Zip中選擇「編輯」,它應該彈出在記事本中打開。如果這不起作用,只需提取該文件,然後將該文件的結尾重命名爲「.txt」。

現在你可以在記事本中打開它,它應該精美地複製並粘貼到Excel中。

從這裏在Excel中選擇「Data」 - >「Text to Columns」 - >「Delimited」 - >並檢查底部的「custom」選項,我相信一個「 - 」服務器如何輸出日誌。

這應該把所有東西都分解成不同的列。它會進行每個人與服務器進行的每一次交互 - 從哪個圖片下載他們的圖片......哪些css文件......是否已下載以查看您的網頁......所有內容。它還方便地具有時間戳,IP,引用URL和Useragent(瀏覽器信息)。

不要太深入Excel,但您可以選擇所有列,然後選擇「刪除重複項」下的「數據」選項卡,並只檢查具有IP的列以獲得獨特的訪問。您也可以在所有列上使用Excel的過濾器選項(同時選擇所有列並單擊「數據」 - >「過濾器」以查看您想要的內容。例如,使用過濾器指定Excel僅顯示行不包含「.jpg」或「.css」....等。噸的選項那裏。取決於你的經驗,但Excel。

我有一種感覺statcounter可能是你在找什麼。

否則,你可以在每個頁面的頂部放一些PHP代碼,並將其發佈到你的服務器或數據庫的.txt文件中,如果你想要的話。使用關係數據庫等,特別是只處理你想要的東西,直到你得到很多流量 - 真的變得非常必要 - 就像1每分鐘200-200名訪問者 - 和/或你正在用這些數據做動態的事情。

希望這會有所幫助。否則,我可能完全用錯誤的方向射擊 - 哈哈。

+0

嗨,約翰,感謝您花時間寫出詳細的答覆。我想我並不清楚我的需求。這是針對擁有多個擁有自己頁面的多個用戶的網站,並且每個頁面都使用統計信息向用戶顯示其頁面的各個統計信息。雖然我可以使用類似服務器日誌文件的東西,但這會比收集數據並將其按需顯示給每個用戶更加困難。我試圖弄清楚的是如何確定數據,數據庫,單個平面文件或多個平面文件。 – Daniel

+0

是的,自從我在您的問題中閱讀「關係數據庫」這個詞以來,我有種感覺, –

+0

雖然我只是在這裏沒有經驗的負載/計算機假設,但我會去多個平面文件的數據庫,取決於您的服務器/數據庫上每個單獨的連接負載多少。否則,我認爲一個平面文件很可能會讓事情變得緩和 - 而流量分析可能無法滿足客戶的需求。我知道如果你使用mysql memcached可能會派上用場以及其他幾個工具。這對您的具體情況來說似乎是一個非常具體和習慣性的問題。如果你想嘗試在AWS中進行拍攝,只需搜索60的功率:) –