2015-05-02 26 views
1

我一直在努力讓GSA在內容抓取過程中度過一段美好的時光,並且總是看到搜索結果的問題,預期的結果永遠不會存在或找到錯誤的地方,這可能是由於到錯誤的配置或其他東西。但它一直在工作。GSA抓取與內容提要哪種方式更好的方法

由於網站上次更新,結果排序現在亂成一團,我無法找到出路。最後修改日期(元標記)的模式與新頁面沒有什麼不同,我猜這是由於內容存在很大的不一致性,無論我是何種日期還是重新發布,搜索總是從舊內容開始。

我在考慮切換到內容提要,並使用內容提要將所有內容從數據庫提供給GSA。但想知道意見是這是更好的辦法或抓取仍然是一個更好的選擇...

回答

0

你必須告訴GSA哪個日期用於排序結果。 默認情況下,GSA會檢查「Last-Modified」響應標頭(抓取網頁內容時)以更新排序日期,即<FS name="date" value="YYYY-MM-DD">。如果您的應用程序未發送「Last-Modified」響應標題,則必須在GSA管理控制檯上配置「文檔日期」。它將幫助GSA從您的元數據中提取日期並相應地更新FS日期。

你可以閱讀有關文件日期配置here

關於你的問題上,這是更好的Web爬行或內容飼料,飼料 是指爬行這就需要特別處理的文檔。 Read this瞭解何時/爲什麼要使用Feed。如果您的GSA可以通過網絡抓取內容,則應選擇使用網絡抓取。

Regards,

Mohan。