2013-08-02 44 views
5

我注意到,對於我的網站摘要,Google Bot似乎正在創建第一批發現的文本。這恰好是告訴用戶打開JavaScript的noscript標記,如果它未啓用。如何將網站摘要提供給Google Bot?

我以爲我會挫敗它,通過在此之前放置一個隱藏的div,實際上包含網站摘要。

現在,我發現在它的最新解析中,它實際上加載了頁面,並運行了JavaScript,繞過了隱藏的div並使用了生成的動態內容。

奇怪的是,我的應用程序將bot識別爲Safari瀏覽器,但它沒有檢測到版本。

爲了長話短說,我如何正確地將我的網站摘要導入到Google列表中?

這是一個單頁面應用程序,需要JavaScript,目前只支持FireFox和Safari。

下面是它忽略

片段1(頭)

<meta name='description' content='My Summary'> 

片段2(身體)

<body> 
    <div id='google_bot' style='display:none'> 
    My Summary 
    </div> 

更新:

上次抓取我的網頁時,它被檢測爲Chrome 22,並且在網站摘要中確實使用了帶有名稱描述的元標記。

+0

你有描述meta標籤? – FakeRainBrigand

+0

這只是十個足球場的服務器,它不是一個真正的機器人,你可以抓住你的手? – adeneo

+1

Google決定描述是否準確反映頁面內容。可能有一些未公開的黑客攻擊,但正確的方法是將描述更新爲其相信的內容(使用頁面上的文字)。但它有很多問題。 YouTube經常有「您需要Adobe Flash ...」。我已經提交了一份關於它的錯誤報告。 – FakeRainBrigand

回答

4

這應該很容易找到。

在3個地方放置網站描述,元標記,隱藏div以及Google bot在上次搜索中找到的內容。使用小點來區分3,如標點符號。

下一步。提交您的網頁,供Google使用Google Web Tools進行抓取,因此您無需等待。它應該只需要大約15分鐘。

一旦它被提取,你可以驗證它拉起你想要它,然後你可以將它提交給索引。

從那裏可以看到發生了什麼變化,並驗證了它所檢索的內容。

奇怪的是,它將自己標識爲Safari。

這裏是關於用戶代理應該是什麼樣子的一些信息:

https://support.google.com/webmasters/answer/1061943?hl=en

+0

關於用戶代理,請注意,您鏈接到的頁面上的幾個故意與瀏覽器類似。此外,該列表用於將指令*定位到機器人,而不是檢測其流量;他們也可能會使用欺騙用戶代理來檢測試圖欺騙索引器的網站。 – IMSoP

+0

Google Bots的用戶代理清楚地顯示在我發佈的鏈接上。這個問題/答案僅適用於Google。爸爸是老闆。 – 2013-09-12 13:41:13

3

如果你有真正獨特的新的連續有趣的內容,那麼你可能會產生a well marked-up RSS feedRSS -> Rich Site Summary只有相關的東西,並添加元標記,

<link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="${linkToFeed}"> 

我認爲谷歌機器人只要它驗證愛它RSS-Feed表示實際頁面的內容

+1

有趣的是,是什麼導致你這個假設? – Smurfette

+0

,因爲整個前端不需要收集主數據,所以收集關於用戶如何體驗數據的數據非常重要,但是如果您提供了一個易於解析的機器可讀格式,爲什麼不採取並保存一些樹,想象一下多少垃圾和workarrounds和web代碼的大量代碼圍繞有趣的數據。沒有任何保證,我認爲它只是邏輯 –

+0

@johnSmith谷歌不是「拯救樹木」(甚至虛構的數字)業務,他們的業務是提供相關的*垃圾郵件*搜索結果。不幸的是,這意味着他們*不能相信機器可讀的頁面版本,因爲您可能會向機器說謊您正在向人類展示的內容。 – IMSoP

相關問題