對於我的一個課程,我們需要計算訪問網站的用戶的會話長度。我們被給了一個網絡日誌。該網絡日誌的格式如下:確定網站的會話時間
IPAddress date httpMethod httpStatus size referrer browserInfo
- 的
httpMethod
看起來是這樣的:GET /include/main_page.css HTTP/1.1
- 引用者總是主頁:
http://www.cs.myCollage.com
或-
我使用的超時值20分鐘。
問題: 我不知道如何判斷會話何時結束,而不是超時。超時結束會話的唯一方法是什麼?有沒有辦法檢測用戶何時離開站點(僅使用日誌中的信息)?
這是我目前的戰略(假設我們有這些日誌):
IPAddress Time httpMethod ...
IP1 2:15 GET something
IP1 2:17 GET something else
IP1 2:30 GET something else
IP1 4:30 GET something else
IP1 4:32 GET something else
這意味着用戶有過兩次會議。我認爲第一場會議是或者 15分鐘或 35分鐘。我應該在會話時間中包含超時嗎?
第二次會議將在2分鐘到22分鐘之間。
這個問題與算法有關,但與其他標籤只有短暫的關係。如果你只給了它'算法'標籤,你可能會有更多的意見。標籤「解析」更多的是這個問題的精神,而不是「網絡」或「網絡開發」。 – Dialecticus 2010-11-13 00:43:33