2009-05-23 63 views
0

所以我一直在使用一個爬蟲腳本來使用Zend Lucene搜索來索引我網站上的所有頁面。我已經能夠使腳本正常工作,但出於某種原因,無法在頁面上找到其他鏈接。這個問題似乎是當腳本打find方法:使用Zend Lucene搜索沒有找到匹配

$hits = $index->find('url:'.$targets[$i]); 

當我執行該腳本有數組這樣的履帶式指數只有起始URI中沒有命中。關於我可以嘗試的任何想法?

+0

您確定您不覆蓋每種類型的$ hit嗎? – xenon 2009-05-23 18:55:15

回答

2

有一種工具可以查看lucene索引,它可以讓你看到索引的內容。 Luke應該讓你看看什麼已經索引和測試一些搜索。

確實,當你創建索引的URL字段建立索引,這是可能的,你可能只是存儲的信息,而不是讓被搜索:

激活addField(::若干Zend_Search_Lucene_Field不索引

。因爲它沒有被索引

0

如果你在你的索引號,這將有助於將不會被發現

要認識NUMERICS使用: Zend_Search_Lucene_Analysis_Analyzer :: setDefault(new Zend_Search_Lucene_Analysis_Analyzer_Common_TextNum_CaseInsensitive()); 作爲默認分析器。 欲瞭解更多信息請參考 http://framework.zend.com/manual/en/zend.search.lucene.extending.html