我目前正在使用Drupal 7網站。添加以下到我的robots.txt文件(下# Directories
部分)禁止:/網站/默認/文件/不適用於我的Drupal網站
Disallow: /sites/default/files/
但是當我鍵入谷歌「網站:www.example.com類型pdf」,它仍然能夠爬進我的/sites/default/files
文件夾。任何人都可以請幫我找出爲什麼這些仍然被抓取?
我在這裏得到的唯一相關的鏈接是:Can I add sites/default/files in robots.txt?它不回答我的問題。
第一個解釋是有道理的。我最近添加了這個到我的robots.txt文件。 對於第二種解釋,我已經爲所有用戶代理添加了這一點。你可以在這裏看到我的robots.txt文件: https://www.familyoffice.com/robots.txt 謝謝你抽出時間幫助我。 – user3570925 2014-10-20 14:56:41
@ user3570925:您的robots.txt看起來不錯。因此,Google應該停止立即抓取這些流程。但是,正如所解釋的,可能會出現這種情況,即您的網址保留後,但不會從您的網頁中獲取標題/摘錄。 – unor 2014-10-20 18:11:47