當我在我的日誌中看到一些IP在我的網站上滾動了100多頁時,該怎麼辦?我有一個WordPress的博客,似乎這不是一個真正的人。幾乎每天都會有不同的IP。當我看到一些IP在我的網站上查看數百頁時,這意味着什麼?
更新:哦,我忘了提及,我敢肯定這不是一個搜索引擎蜘蛛。主機名不是搜索引擎,而是來自印度的隨機人員(以'.in'結尾)。 我所關心的是,如果它是刮板,有什麼我可以做的嗎?或者它可能比刮板更糟糕。黑客?
當我在我的日誌中看到一些IP在我的網站上滾動了100多頁時,該怎麼辦?我有一個WordPress的博客,似乎這不是一個真正的人。幾乎每天都會有不同的IP。當我看到一些IP在我的網站上查看數百頁時,這意味着什麼?
更新:哦,我忘了提及,我敢肯定這不是一個搜索引擎蜘蛛。主機名不是搜索引擎,而是來自印度的隨機人員(以'.in'結尾)。 我所關心的是,如果它是刮板,有什麼我可以做的嗎?或者它可能比刮板更糟糕。黑客?
這是一個蜘蛛/履帶。搜索引擎使用這些來編譯他們的列表,研究人員使用它們來找出互聯網的結構,互聯網檔案館使用它們爲下一代下載互聯網的內容,垃圾郵件發送者使用它們來搜索電子郵件地址,以及許多更多這樣的情況。
檢出日誌中的用戶代理字符串可能會提供更多關於他們正在執行的操作的信息。行爲良好的機器人通常會說明他們是誰/他們是什麼 - 例如,Google的搜索機器人被稱爲Googlebot。
可能是一些腳本小孩希望利用博客(或服務器)中的漏洞利用。那還是一些網絡爬蟲。
這可能是一個蜘蛛網站索引您的網站。 「用戶代理」可能會將其刪除。如果不是所有的博客頁面,但包含css,js和圖片等內容,可以輕鬆地爲動態生成的Wordpress網站提供100多個GET請求。
如果您擔心腳本小子,建議您檢查錯誤日誌。劇本通常會尋找你可能沒有的東西;例如在我運行的一個系統上,我沒有ASP,但是,我可以告訴腳本小孩何時檢測了該站點,因爲我看到很多嘗試在我的錯誤日誌中查找ASP頁面。
歡迎來到互聯網。當你把東西放在網上時,任何人都可以接受。這是這樣的想法。 – GEOCHET 2009-05-28 13:07:44
如果是黑客或其他東西我更害怕 – chris 2009-05-29 01:16:47
我很難理解以'.in'結尾的主機名與它不是搜索引擎之間的聯繫。 – 2010-04-26 22:40:04