2011-12-10 80 views
0

我有這個歌網站什麼都數據已同被顯示在其他網站 即使我回聲「你好」同樣是在其他網站做沒有任何身體知道如何阻止這 只是更深入地讓我發現網站使用的file_get_contents()我怎麼能阻止他這樣做,如何從刮我的網站停止網站

+1

重定向起訴他們將是最好 選項,如果可能 –

+0

我從一個網站獲得一些外匯資訊,當他們認識到他們通過js更改了代碼和加載信息時。 –

+0

如果你困擾,你仍然可以獲得信息。 – 2011-12-15 14:30:53

回答

0

你說file_get_contents正在被使用。

A URL can be used as a filename with this function if the fopen wrappers have been enabled. See fopen() for more details on how to specify the filename. See the Supported Protocols and Wrappers for links to information about what abilities the various wrappers have, notes on their usage, and information on any predefined variables they may provide.

要禁用它們的詳細信息,在http://www.php.net/manual/en/filesystem.configuration.php#ini.allow-url-fopen

編輯:如果他們去使用捲曲或在此之後等效,通過改變HTML佈局等嘗試和亂用他們的腳本如果沒有幫助,試圖找到腳本主機的IP,並使其返回廢話;)

EDIT2:如果他們使用iframe使用JavaScript對iframe中檢測

2

那麼,你可以嘗試dermine他們的IP地址,並阻止它

+0

這不是一個很好的選擇動態IP呢? –

+0

我知道的大多數爬蟲不使用動態IP。他們可能會旋轉他們,但他們是從服務器enviroments,不是典型的國內一線 – Pleun

+0

我用此溶液同意就跑,遠遠阻止他們的IP地址或範圍。他們最終會用完。 :) – brant

0

或者你甚至可以爲該爬蟲生成垃圾信息,只是爲了搞亂「克隆」網站。

第一個需要回答的問題是:您是否確定了抓取工具從您的網站獲取信息?

如果是這樣,那麼你就可以給你想這個過程什麼:無(忽略/塊),一條消息,告知車主停止獲取您的信息,讓他們回來的垃圾內容,...

不管怎麼說,第一步是妥善處理事情。請確保您的網站有適用於抓取工具的已接受政策的「robots.txt」。