2010-08-17 59 views
1

背景將RSS提交作爲站點地圖提交給Google?

我爲承載一個新聞網站,擁有超過7.5萬頁的在線媒體公司工作。我們目前使用Google Sitemap Generator(安裝在我們的服務器上)爲我們的網站構建動態XML站點地圖。實際上,由於我們有大量內容,因此我們使用站點地圖的站點地圖。 (谷歌只允許最多50K網址。)

問題

的站點地圖生成每12小時,並通過用戶行爲來驅動。也就是說,它解析服務器日誌文件,並查看哪些頁面被抓取得最多,並基於此創建站點地圖。

由於我們無法保證將新網頁添加到站點地圖,因此最好是將站點地圖提交爲RSS源?這樣,每當我們的編輯創建一個新的頁面(或文章)時,它就會添加到Feed中並提交給Google。這引發了將重複內容推送到谷歌的問題,因爲站點地圖和RSS提要可能包含相同的URL。谷歌會懲罰我們的重複內容?其他內容豐富或媒體網站如何通知谷歌他們正在發佈新內容?

據我所知,googlebots只索引它認爲重要且相關的網頁,但如果至少抓取了我們發佈的任何新文章,那將會很棒。

任何幫助將不勝感激。

回答

1

爲什麼不簡單地在您的站點地圖中每頁面有? 75k頁面並不是一個龐大的數字,大量的網站有幾個網站地圖總共數百萬頁,谷歌會將它們全部消化(儘管谷歌只會索引你認爲重要的那些)。

對於您來說,一種技術是將站點地圖根據發佈日期分成新建和存檔內容 - 例如前7天內的所有內容的單個站點地圖和其他內容分割爲其他站點地圖文件在適當的情況下,這可能有助於快速獲取最新索引的內容。

回到關於RSS源站點地圖的問題 - 不必擔心重複的內容,因爲這對於站點地圖而言不是問題。如果您在網站上多次發佈同一文章,則重複的內容只是一個問題 - 站點地圖和RSS源只是鏈接而不是內容本身,所以如果RSS源是報告新鮮內容的最簡單方式去谷歌,去吧。