2010-11-08 30 views
0

我有一個我用Django構建的網站。使用settings.py文件,我向自己發送從站點生成的錯誤消息,部分是爲了讓我可以看到是否有任何錯誤。有人試圖破解我的Django網站

我不時得到相當奇怪的錯誤,他們似乎主要是圍繞網站的相同區域(我寫了一個小教程試圖解釋我如何設置Django博客引擎)。

我得到的所有錯誤都顯示爲我可以在錯字中完成的事情。

例如,這兩個錯誤非常接近。我從來沒有在這些頁面上使用'x'或'post'作爲變量。

'/blog_engine/page/step-10-sub-templates/{{+x.get_absolute_url+}}/'

「/ blog_engine /頁面/步驟-10-子模板/ {{+交.get_absolute_url +}} /」

用戶代理是:

'HTTP_USER_AGENT': '的Mozilla/5.0(兼容; Purebot/1.1; + HTTP://www.puritysearch.net/)',

我認爲它是一個刮刀機器人,但我無法弄清楚他們能夠用這種攻擊得到什麼。

冒着聽起來很愚蠢的風險,我該怎麼辦?這是一個黑客企圖,或者他們只是試圖複製我的網站?

編輯:我會按照已經給出的建議,但我真的很好奇爲什麼有人會像這樣運行一個腳本。他們只是試圖複製。它不會觸及管理頁面,甚至沒有任何形式。這似乎是無害的(除了潛在的剽竊)試圖挖掘和發現內容?

回答

8

從您的USER_AGENT信息看起來這是一個來自puritysearch.net的網絡蜘蛛。

  1. 我建議你做的是把一個CAPTCHA代碼在你的網站。當程序嘗試在10秒內訪問10個頁面時觸發(大多數情況下,沒有人會這樣做,或者找出適當的標準來觸發您的CAPTCHA)。
  2. 此外,維護robots.txt文件,大多數爬蟲的榮譽。在robots.txt中提到你的規則。您可以說抓取工具阻止您的網站的某些繁忙部分等。
  3. 如果問題仍然存在,您可能需要聯繫該特定站點的系統管理員&試圖找出發生了什麼事情。

這樣,您不會完全阻止抓取工具(您的網站變得流行所需),同時確保您的用戶在您的網站上獲得快速體驗。