2014-04-04 75 views
2

我想了解Google AJAX爬行。Google如何處理相對_escaped_fragment_網址?

說,我有一個這樣的HTML頁面在example.com

<title>My Page</title> 
<a href="#!foo=bar">Some link</a> 

爬行時的#!foo=bar鏈接,谷歌將獲取example.com?_escaped_fragment=foo=bar。作爲對此的迴應,我將服務於以下HTML:

<title>My Other Page</title> 
<a href="#!blah=zap">Another link</a> 

現在的問題是,怎樣將谷歌認爲#!blah=zap聯繫呢?我看到兩種可能性:

  • 谷歌將把該URL爲example.com?_escaped_fragment=blah=zap,併成功抓取的頁面。

  • Google會發現這個相對網址真的會解析爲example.com?_escaped_fragment=foo=bar#!blah=zap,並且無法抓取我想要的網頁。

那麼可能是哪一種?

PS。有什麼方法可以測試這個嗎?我一直在使用「Google抓取方式」服務,但並未告訴我如何抓取它在網頁上找到的鏈接。

回答

2

您查看:Full specification of _escaped_fragment_

關於你的問題,我會建議谷歌將解釋爲:「谷歌將把URL作爲example.com?_escaped_fragment=blah=zap並且將成功獲取該頁面。」

+0

好的。謝謝。消化所有這一切後,我的推理認爲,在最糟糕的情況下,Google會將網址翻譯爲'example.com?_escaped_fragment_ = something&_escaped_fragment_ = somethingElse',其中第二個參數將覆蓋第一個參數,讓我們留下'example.com?_escaped_fragment_ = somethingElse',這意味着我的鏈接肯定會起作用。所以謝謝你花時間回答。 –