2009-01-26 71 views
0

我想知道流量高的網站如何處理流量記錄,例如像myspace.com這樣的網站會收到很多點擊量,我可以想象它會佔用大量空間來記錄所有這些請求,所以,他們會記錄每一個請求嗎?或者他們如何處理這個問題?在高流量網站上記錄請求

回答

1

可能像谷歌分析。

使用JavaScript的不同服務器上加載頁面等

0

不要他們是如何跟蹤它,因爲我沒有在那裏工作。我非常肯定,他們有足夠的存儲空間來記錄關於用戶的每一件小事情,如果他們想要的話。

如果我是他們,我會使用AwStats,如果我只想知道關於我的用戶的基本信息。 他們更有可能開發了自己的腳本來跟蹤用戶。東西,他們就會登錄 -ip_address
-referrer
- 時間
-browser
-OS

等。然後用腳本查看關於用戶的不同日期,周或月的不同數據。正如Brulak所說的那樣,這是分析的一部分,但由於他們可以訪問實際的數據庫,他們可以瞭解更多關於用戶的信息。

3

如果一個MySpace網頁上查看源代碼,你得到的答案:

<script type="text/javascript"> 
var pageTracker = _gat._getTracker("UA-6293770-1"); 
pageTracker._setDomainName(".myspace.com"); 
pageTracker._setSampleRate("1"); //sets sampling rate to 1 percent 
pageTracker._trackPageview(); 
</script> 

該腳本意味着他們使用谷歌分析。

他們不能僅僅使用IIS日誌來衡量流量,因爲他們可能會向第三方出售廣告,並且第三方將不會接受您獲得的流量。他們希望獨立公司提供獨立號碼,這就是Google Analytics(分析)的用途。

僅供將來參考 - 每當您對某個網站的操作有疑問時,請嘗試查看源代碼。你會驚訝於你能在普通視圖中找到的東西。

+0

有點功課總是回答簡單的問題。謝謝你做功課 – 2009-01-27 18:38:34

3

說我們與出內部網上使用數百人一個類似的問題。磁盤活動巨大,性能受到影響。

簡短的答案是異步非阻塞日誌記錄。

0

如果他們沒有記錄每一個請求,我會感到非常驚訝,是的,流量特別高的操作通常以某種形式或其他形式針對原始服務器日誌推出自己的日誌管理解決方案 - 有時作爲簡單的批處理過程,有時作爲完整的子系統。

在dot-com全盛時期,我曾經工作過的一家公司每天獲得了超過兩千萬的綜合瀏覽量;對於該網站(實際上我們記得它們是一組網絡,運行在幾十臺機器上),我們的操作團隊編寫了一個非常複雜的C集羣解決方案,解析,翻譯(關聯存儲),壓縮並分發每日記錄。日誌文件,尤其是冗長的日誌文件堆積得很快,當時可用的商業解決方案無法削減。

0

如果通過記錄你的意思是收集與服務器相關的信息(請求和響應時間,每個請求的數據庫和CPU使用情況等),我認爲他們僅採樣10%或1%的流量。這給出了相同的結果(爲開發人員提供審計信息),無需填寫磁盤或減慢網站速度。