2011-01-19 50 views
6

我正在尋找BOTS的用戶代理(爬蟲,蜘蛛,twitter機器人等)的完整列表。如何知道HTTP請求是否是BOT

你知道嗎?

感謝

+0

這與編程有什麼關係? – sbi 2011-01-19 10:39:13

+0

我需要它來過濾HTTP請求 – Himberjack 2011-01-19 10:45:55

+2

谷歌下降你住的地方?幸運的是它適用於我。在這裏你可以去:[http://www.user-agents.org/](http://www.user-agents.org/)。 – 2011-01-19 10:55:51

回答

3

長話短說:你不能,沒有銀彈。任何機器人都可以將他們的user-agent字符串設置爲'googlebot'到'spamalot'之間的任何內容。

你可以親自看到它,你需要做的就是去Shinnok指出的第一個站點,並開始計算那裏列出的所有那些Googlebot/2.X機器人。你阻止他們,他們改變機器人的名稱爲隨機亂碼等。最後,您最終會得到一個10k的機器人列表,當您嘗試驗證它們是否是機器人時,會減少用戶的加載時間。

相關問題