2010-03-28 39 views
4

我在我的網站上使用獅身人面像作爲搜索引擎,它的工作非常完美,我沒有抱怨過。它唯一缺乏的是,它不允許我搜索查詢長度超過15個字的文章。我知道在現實中人們不會使用超過3-4個字我想用它來查找重複的內容。php中的文章搜索引擎

我想知道是否有任何替代解決方案的獅身人面像。我想要處理重複的內容。

我的主要文章表是innodb,但我也緩存文章到MyISAM表以及全文搜索,但是當我搜索一篇文章,它需要年齡來執行一個搜索。它不是查詢問題,我認爲MySQL缺乏全文搜索功能。

感謝 傑森

+0

你想要構建什麼樣的查詢可以幫助你找到重複的內容? – Cam 2010-03-28 00:18:43

+1

僅供參考,在最新版本的sphinx中刪除了「太多關鍵字」的限制 – user187291 2010-03-28 01:06:25

+0

@stereofrog沒有它,我正在windows和centos上運行最新版本的sphinx。 – Jason 2010-03-30 16:16:24

回答

1

Apache Solr是一個另類。它基於Apache的Lucene項目...

您可能還想檢查Lucene以及。

而且由於你使用MySQL,檢查它的全文搜索MySQL Full Text Searching

+0

@stereofrog你是對的。我有舊的PHP API這就是爲什麼它不允許我使用完整的查詢。謝謝 – Jason 2010-03-30 19:40:39

0

也許沒有幫助,但是您可以簡單地向MySQL字段添加一個唯一索引以防止插入重複項嗎?

我在使用的獅身人面像版本中沒有遇到任何查詢長度限制(0.9.9),但也許我沒有足夠努力。

+0

我想找到剽竊的內容,所以添加獨特的領域不是一個好的選擇。我現在可以在獅身人面像插入完整的查詢,但現在它不斷崩潰:( – Jason 2010-03-31 12:15:21