0
如果我去這個網址 http://sppp.rajasthan.gov.in/robots.txt網站谷歌的標籤沒有顯示所有結果
我得到
User-Agent: *
Disallow:
Allow:/
這意味着,爬蟲被允許完全訪問的網站和所有內容建立索引,那麼爲什麼網站:在谷歌搜索sppp.rajasthan.gov.in顯示我只有幾頁,其中它包含大量的文件,包括PDF文件。
如果我去這個網址 http://sppp.rajasthan.gov.in/robots.txt網站谷歌的標籤沒有顯示所有結果
我得到
User-Agent: *
Disallow:
Allow:/
這意味着,爬蟲被允許完全訪問的網站和所有內容建立索引,那麼爲什麼網站:在谷歌搜索sppp.rajasthan.gov.in顯示我只有幾頁,其中它包含大量的文件,包括PDF文件。
可能有很多原因。
Disallow
行:
另外,您可能沒有空行的記錄,因爲它們是用來分隔多個記錄。
仔細看看它。
onclick
JavaScript動態加載,它不會更改URL,所以即使它想要,谷歌也無法鏈接到第2頁。雖然我的原始點仍然存在。 Google應該能夠找到位於http://sppp.rajasthan.gov.in/actrulesprocedures.php頁面的http://sppp.rajasthan.gov.in/sppp/upload/documents/5_GFAR.pdf。如果您對某個特定頁面可能缺失的原因有疑問,我會盡力回答。
但基本上網站做了一些奇怪的非標準事情,這正是你需要一個網站地圖。相反,流行的信仰網站地圖是而不是搜索引擎優化,這是當谷歌無法找到您的網頁。