2011-05-02 26 views
0


我們現在有很多網站都使用log4net基本錯誤日誌框架,並且我們收到來自任何地點的錯誤追加。我們注意到他們中的一些人因爲像谷歌,bing,雅虎等「機器人」而發生錯誤。但是有一些我們不確定如何解決。我有兩個關於它的問題:Java/1.6.0_24是一個殭屍程序,以及如何強制它們刷新它們的鏈接

  1. 「Java/1.6.0_24」是一個Bot嗎?因爲我的問題#2的用戶代理是關於這個的。
  2. 「Java/1.6.0_24」仍然調用我們網站上不存在的子文件夾!就像,如果我們有一個名爲「Page1.aspx」的頁面,而不是調用「〜/ Page1.aspx」,他將其稱爲「〜/ minisite/Page1.aspx」。我怎麼能告訴他他錯了?有沒有辦法做到這一點?

感謝您

回答

1
  1. 這很可能是一個機器人,但它可能也有某種瀏覽器的基於Java發送用戶代理字符串 - 你不能相信它100%,但它可以給你一個關於連接實體是什麼的估計概念。根據機器人的種類,它可能只是忽略你的robots.txt,所以我只是在某處處理一些處理的東西。

  2. 這些文件夾是否存在?如果是這樣,你可以使用HTTP's permanent redirect(代碼301)告訴他不再看那裏 - 但不能保證它會這樣做。

+0

謝謝馬里奧。但必須說,子文件夾根本不存在。我會嘗試HTTP的永久重定向 – 2011-05-02 13:26:05

+1

在這種情況下,我只是返回HTTP 404並擰上機器人,工具或任何其他。滿足所有請求並不是您的責任,特別是那些從來沒有效的請求。只要添加一些額外的過濾器,如果這些錯誤聚集您的日誌文件。 – Mario 2011-05-02 13:27:43

+0

但它意味着我必須創建該文件?就像,如果他稱之爲「〜/ microsite/Page1.aspx」並且它不存在,我創建它並返回一個HTTP 404或者有另一種方法來執行它? – 2011-05-02 13:41:51

相關問題