2012-04-12 80 views
2

我想阻止谷歌索引pdf在我的網站上。如何判斷Apache是​​否按照預期使用我的.htaccess?

我已經修改我的.htaccess文件包含以下行,如建議由谷歌的網站管理員工具:

<Files ~ "\.pdf$"> 
    Header set X-Robots-Tag "noindex, nofollow" 
</Files> 

我知道,Apache是​​正常運行和閱讀我的.htaccess文件,因爲我可以阻止訪問到文件完全,但我不知道上述命令是否工作。

谷歌網站管理員工具聲稱,爬蟲仍然可以看到PDF文件,但他們似乎只用於使用robots.txt使用。是否有第三方工具(用於Linux),我可以用它來檢查元標記?

回答

1

你可以在某些PDF文件使用wget,看看標題:

wget -S http://host/something.pdf 
+0

感謝,這正是我一直在尋找的標誌。 – 2012-04-13 01:24:27

相關問題