2012-03-25 89 views
0

我對此有幾點想法,但是我可以看到兩者都存在問題。我不需要100%準確的數據。一個80%的解決方案,使我能夠推廣關於我路由用戶的最流行的域名是好的。如何跟蹤傳出鏈接點擊而無需跟蹤漫遊器?

選項1 - 使用PHP。通過track.php文件路由鏈接,確保在跟蹤點擊之前引薦頁面來自我的網域。然後該頁面將用戶路由到最終的預定URL。很顯然,機器人可能會欺騙這個。做很多?我也可以檢查用戶代理。再次,我知道很多機器人都在欺騙這個。

選項2 - 使用JavaScript。在點擊功能上執行JavaScript,將點擊寫入數據庫,然後將用戶定向到最終的URL。

這兩種方法都覺得它們可能會導致抓取工具在我的傳出鏈接之後出現問題。跟蹤這些傳出點擊的最有效方法是什麼?

回答

1

跟蹤外出鏈接(Facebook,Twitter和幾乎所有搜索引擎使用的)最有效的方法是「track.php」類型的文件。

檢測機器人可以被認爲是一個單獨的問題,並且這些問題可以很好地覆蓋這些方法:http://duckduckgo.com/?q=how+to+detect+http+bots+site%3Astackoverflow.com但是,在User-Agent中對「bot」進行簡單的字符串搜索可能會使您接近80% (並根據你正在處理的機器人的類型觀看/robots.txt的點擊率,讓你95%*)。

*:半猜測,基於零個具體數據

1

那麼,谷歌分析和Piwik使用JavaScript這一點。

因爲機器人不能使用JS,所以只會有人類。換句話說,人類也可以禁用JS(但真誠的情況很少如此)

Facebook,Deviantart,WLM等使用服務器端腳本來跟蹤。我不知道他們是如何過濾漫遊器的,但是有一個或兩個過濾器的robots.txt,而且應該足夠好以獲得80%的猜測。