2012-09-03 39 views
1

運行WordPress的客戶請求在其網站上開發以下功能。隱藏搜索結果中上傳的文件?

他們希望包含/排除通過從搜索結果中WordPress的媒體上傳上傳特定文件(通常爲PDF)。

我猜這可以在某種程度上使用robots.txt文件來實現,但我不知道從哪裏開始。

任何意見/想法?

+2

這是一個現有的客戶。但是,優秀的理論。堅持你所知道的,不要承擔任何可能證明具有挑戰性的工作。這是自我發展和提高技能的絕佳方式。 – Scully

+2

做網絡開發工作,不知道什麼是robots.txt,它是如何工作的,在你問一個問題之前不用谷歌做任何研究是一個跡象,表明你的工作做錯了。甚至沒有接近具有挑戰性。你想證明你不是懶惰的「給編碼」的人 - 開始研究,並告訴我們,你甚至已經試圖解決**你的**問題。除了在這裏問的問題,你目前的工作是什麼? – zerkms

+0

誰說我不懂robots.txt文件?我面臨的問題是在WordPress媒體上傳器中設置一個選項,以便從搜索結果中包含/排除上傳的文件。過去30分鐘我一直在Google上搜索(失敗),這就是我來這裏的原因。 – Scully

回答

0

這是從谷歌網站管理員Developers網站https://developers.google.com/webmasters/control-crawl-index/docs/faq

它需要多長時間對我的robots.txt文件的更改會影響我的搜索結果?

首先,robots.txt文件的緩存必須進行更新(我們一般緩存的內容長達一天)。即使發現更改後,抓取和索引也是一個複雜的過程,有時需要一段時間才能處理單個URL,因此無法提供確切的時間表。另外請注意,即使您的robots.txt文件禁止訪問某個網址,該網址仍可能會在搜索結果中保持可見狀態,儘管我們無法抓取該網址。如果您希望加快刪除已阻止Google訪問的網頁,請通過Google網站管理員工具提交刪除請求。

這裏是robots.txt的規格從谷歌https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt

如果你的文件的語法是正確的最好的答案只是等待,直到谷歌更新您的新的機器人的文件。

0

我不確定如何在WordPress的範圍內做到這一點,但如果你想排除特定的文件類型,我會建議使用X-Robots-Tag HTTP Header。對於您通常希望使用機器人標籤的PDF和非基於HTML的文件類型而言,它尤其好用。

您可以添加標題爲所有特定文件類型的請求,然後設置NOINDEX的值。這將防止PDF被包含在搜索結果中。

您可以使用robots.txt文件,如果使用的URL文件類型或東西是獨特的文件類型結束。例如:Disallow: /*.pdf$ ...但我知道URL並非總是如此。

https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag