最近我注意到Facebook的對象調試器無法刮取我網站的任何頁面。在對互聯網進行故障排除和沖刷後,我對可能導致此錯誤的原因感到不知所措。Facebook調試器返回「文檔沒有返回數據」
每當我試圖去拿我的網站的一個新的刮,返回以下錯誤:
錯誤解析輸入URL,沒有數據緩存,或者沒有數據被刮掉。
當點擊進入「看正是我們的刮板看到了你的URL」,刮板回報:
文檔返回任何數據
這顯然是一個有點難以調試給出缺乏數據。下面是我迄今爲止嘗試:
- 經過DNS設置,一切似乎很動聽
- 嘗試使用「取像谷歌,」 Googlebot會沒有問題
- 驗證所有元設置上抓取的網頁HTML網站。
fb:app_id
,og:title
,og:description
,og:site_name
,og:url
和og:type
都存在。 - 確保規範URL引用主頁,並且沒有任何結尾斜線或尾隨數據。
- 已回滾承諾我在什麼可能會造成這個損失上次成功抓取日期
之前。如果任何人有任何想法,或需要更多信息,我會很樂意提供。
檢查訪問日誌後,我看到以下內容:
173.252.112.115 - - [22月/ 6/2015:20:49:02 0000] 「GET/HTTP/1.1」 404 993「 - 」 「facebookexternalhit/1.1 (+ http://www.facebook.com/externalhit_uatext.php)」
但是,這是奇怪的,因爲它後面緊跟一個普通用戶:
[用戶IP] - - [22 /月/ 2015:20:48:09 +0000]「GET/H TTP/1.1「200 28227 」 - 「」Mozilla/5.0(Windows NT 6.1; WOW64)爲AppleWebKit/535.7(KHTML, 像壁虎)的Chrome/Safari瀏覽器16.0.912.63/535.7"
沒有什麼robots.txt中不允許漫遊
編輯:本網站上運行的Django和AngularJS是,當我訪問您的網頁瀏覽器和發送facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
爲User-Agent
頭的價值服務我的網頁。我使用的Django SEO-JS與預渲染工作,以改善搜索引擎優化。
你可以提供作爲實際頁面的網址嗎?您是否檢查過服務器的訪問和錯誤日志,查看觸發刮擦的時間戳? FB刮板的請求是否能夠到達您的服務器? – CBroe
該網址爲https://taggler.com;我將查看訪問日誌,然後向我報告 –
當我請求一次刮取時,它似乎在我的訪問日誌中註冊。 '173.252.112.115 - - [22/Jun/2015:20:49:02 +0000]「GET/HTTP/1.1」404 993「 - 」「facebookexternalhit/1.1(+ http://www.facebook.com/externalhit_uatext .php)「' 看起來它正在打404?我們有一些日誌表明還有200個響應。 –