2012-12-10 14 views
0

我主持1 & 1共享服務器上的網站,但我需要AJAX加載的內容由谷歌機器人是抓取...該網站是「散列砰」的準備,但現在我與escaped_fragment掙扎部分。 我必須安裝HtmlUnit,Node.js或Zombie.js來幫助谷歌處理我的JavaScript事件。我需要VPS還是可以將共享服務器用於Ajax可抓取網站?

現在我不明白在服務器上安裝這一塊軟件的地方?

雖然我收集的相關信息,我意識到,我可能到其託管在一個虛擬服務器(VPS)的能夠訪問根或安裝庫......我說得對不對?

我不是真的我的兩倍,每年的託管費只是爲了幫助谷歌找到我的內容的想法感到高興......你知道如何實現一個共享的主機抓取AJAX?

如果沒有,有沒有辦法將這些圖書館託管在其他地方,同時保持現在的位置?

我在搜索相關信息的實際的,因爲谷歌是沒有幫助很大這一點,和網上的文章沒有得到真正進入托管部分。 Thx爲您提供幫助!

+0

你爲什麼需要*節點這個?您的網站是否簡單地用Node編寫?那麼是的,你需要一個支持服務器端任何東西的主機。這可能是共享的,也可能是VPS。 – deceze

+0

它無法進行無頭瀏覽嗎?那麼我的網站是一個WordPress的(所以PHP)ajax加載文章。 – wyem

+0

是的,但那又如何?您希望Google爲您的hash-bang網址編制索引。沒有關於這個要求你的服務器是一個無頭瀏覽器。它只是要求你的服務器響應某些特定內容的URL。任何網絡服務器都可以做。 – deceze

回答

0

所以,你通過AJAX提供的博客文章與hashbang網址。然後,您需要爲抓取支持做的唯一事情就是使用_escaped_fragment_=work-stuff來處理網址,它們以HTML形式返回的內容與通過AJAX從相應的hashbang網址#!work-stuff返回的內容相同。

例如,讓我們從你的網站爲例採取以下網址:http://www.youpiemonday.com/#!arcena。當瀏覽器在這裏導航時,它會從以下「醜陋」URL收到數據:http://www.youpiemonday.com/arcena/?_=1355151916735。我認爲只要處理抓取工具生成的網址(如),並將它們映射到您爲「醜陋」網址返回的相同內容,就足夠了。這樣你將提供索引的主要內容。

至於無頭瀏覽器,如果您的網頁是由許多小的AJAX請求,接收到的數據建立,將是必需的,而且一整頁表示(主要內容)不會在服務器存在的。然後,您可以使用無頭瀏覽器自行「瀏覽」這些頁面,並將結果頁面快照存儲在某個緩存中,從抓取工具可以獲取純html版本的位置存儲。

對於我來說,看完該網站後,答案是否定的 - 你不需要VPS。

+0

好的,我想我明白了,但您如何處理/映射網址?用PHP?我不是在我的舒適區... :) 對於無頭瀏覽器部分,我很樂意能夠沒有它!但是,由於click事件是由javascript處理的,谷歌爬蟲不會被卡在圖庫級別(即不能看到每個帖子的內容)? – wyem

+0

@wyem,我忘了提,當然你應該使用站點地圖。 – Stan

+0

@wyem,就處理URL而言,如果您提供了一些關於如何執行當前hashbang URL處理的代碼/細節,這將是轉義URL處理中最好的部分。我想你可以以某種方式爲每個hashbang網址添加一個轉義別名。 WordPress似乎有插件。 – Stan

相關問題