我有一個Drupal網站,其頁面由Google Mini Search Appliance索引。Drupal和Google Search Appliance(Google Mini)
在本週早些時候,我注意到一堆鏈接被標記爲索引,但被排除在外,因爲有一個「打印此頁」鏈接回到同一頁面並且具有rel =「nofollow」。我把nofollow拿出來,讓GSA在2天前重新編制網站。
現在,所討論的頁面在GSA中被標記爲索引,但它們沒有出現在網站的搜索結果中。
我可以在/ search/google_appliance/TERM搜索,並且它們不顯示。當我搜索其他條款時,它們確實顯示出來。換句話說,我知道GSA正在工作。
當我在/ search/node/TERM搜索[Drupal默認搜索]時,我得到了不同的Drupal結果[頁面中出現了術語顯示]。這讓我很確定我正在擊中GSA。
關於爲什麼新索引的頁面沒有出現在GSA搜索中的任何想法?
編輯/已解決: 有幾個問題。以前,搜索使用xslt來處理它如何顯示頁面,以及當您點擊提交時(在設備上,而不是網站上的提交按鈕),它在頁面上發送查詢的位置。查詢字符串以舊格式傳遞到網站,然後給出404(同樣的事情,如果您搜索bookstore.site.com和origin.site.com)。更多的'不能從這裏到達'比任何搜索都要做的問題更困難。我已經刪除了xslt,因此它只是使用默認的Google外觀和感覺,並且可以讓我們對設備的數據庫進行很好的通用搜索。
但是,仍然有一些奇怪的搜索結果回來,Drupal模塊無法解析,並且日誌被simplexml_load_string()[function.simplexml-load-string]命中:^在\ sites \ all \ modules中\ google_appliance \ GoogleMini.php on line 318.
我嘗試了一些查詢字符串變量並註釋掉了設置輸出編碼的行,並且所有行爲似乎都行得通。 有問題的行是google_appliance.module行322:
$gm->setOutputEncoding('utf8');
這方面的進展如何?你有沒有找到任何有助於減少要考慮的假設/幫助追蹤問題的信息? – mac