我在根域中有一個WordPress網站。現在,我已經在子文件夾中添加了一個論壇,作爲mydomain /論壇 ,它使站點地圖如下所示:mydomain/forum/sitemap_index.xml。 將該網站地圖提交給谷歌,它聽起來谷歌不能訪問子網站地圖的消息「Url被robots.txt阻止」 - 值:mydomain/forum/sitemap-forums.xml?page = 1 ---值: mydoamin /論壇/網站導航-INDEX.XML?頁= 1。Url被Google網站管理員robots.txt留言阻止
這是我的robots.txt:
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: /feed
Disallow: /comments
Disallow: /category/*/*
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /*?*
Disallow: /*?
Allow: /wp-content/uploads
# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /*
Sitemap: mydomain/sitemap_index.xml
Sitemap: mydomain/forum/sitemap_index.xml
我應該添加什麼的robots.txt?任何幫助將不勝感激。 在此先感謝
謝謝。正如我在我的sitemap-index.xml中看到的,有一些鏈接,如sitemap-thread.xml?page = 1和sitemap-forum.xml?page = 1和....所以,在你的幫助下,我會嘗試這:允許:/論壇/網站地圖*?*(也許將來會有page2,page3,...)。此外,它聽起來我必須等待一段時間(=幾個小時)谷歌重新檢查它。我對嗎? – ALalavi
即使只是「允許:/論壇/網站地圖」應該工作,至少在Google上。對於Googlebot,較長的規則(以字符數計)優先於較短的規則。模式「/ forum/sitemap」長於「/ *?」所以它優先。是的,Googlebot可能需要一段時間才能注意到您的新robots.txt文件。預計需要幾天時間,儘管你可能會很幸運。 – plasticinsect