我在我的網站上使用獅身人面像作爲搜索引擎,它的工作非常完美,我沒有抱怨過。它唯一缺乏的是,它不允許我搜索查詢長度超過15個字的文章。我知道在現實中人們不會使用超過3-4個字我想用它來查找重複的內容。php中的文章搜索引擎
我想知道是否有任何替代解決方案的獅身人面像。我想要處理重複的內容。
我的主要文章表是innodb,但我也緩存文章到MyISAM表以及全文搜索,但是當我搜索一篇文章,它需要年齡來執行一個搜索。它不是查詢問題,我認爲MySQL缺乏全文搜索功能。
感謝 傑森
我在我的網站上使用獅身人面像作爲搜索引擎,它的工作非常完美,我沒有抱怨過。它唯一缺乏的是,它不允許我搜索查詢長度超過15個字的文章。我知道在現實中人們不會使用超過3-4個字我想用它來查找重複的內容。php中的文章搜索引擎
我想知道是否有任何替代解決方案的獅身人面像。我想要處理重複的內容。
我的主要文章表是innodb,但我也緩存文章到MyISAM表以及全文搜索,但是當我搜索一篇文章,它需要年齡來執行一個搜索。它不是查詢問題,我認爲MySQL缺乏全文搜索功能。
感謝 傑森
Apache Solr是一個另類。它基於Apache的Lucene項目...
您可能還想檢查Lucene以及。
而且由於你使用MySQL,檢查它的全文搜索MySQL Full Text Searching
@stereofrog你是對的。我有舊的PHP API這就是爲什麼它不允許我使用完整的查詢。謝謝 – Jason 2010-03-30 19:40:39
檢查Zend_Search_Lucene的還有:http://framework.zend.com/manual/en/zend.search.lucene.html
雖然它比獅身人面像慢。
也許沒有幫助,但是您可以簡單地向MySQL字段添加一個唯一索引以防止插入重複項嗎?
我在使用的獅身人面像版本中沒有遇到任何查詢長度限制(0.9.9),但也許我沒有足夠努力。
我想找到剽竊的內容,所以添加獨特的領域不是一個好的選擇。我現在可以在獅身人面像插入完整的查詢,但現在它不斷崩潰:( – Jason 2010-03-31 12:15:21
你想要構建什麼樣的查詢可以幫助你找到重複的內容? – Cam 2010-03-28 00:18:43
僅供參考,在最新版本的sphinx中刪除了「太多關鍵字」的限制 – user187291 2010-03-28 01:06:25
@stereofrog沒有它,我正在windows和centos上運行最新版本的sphinx。 – Jason 2010-03-30 16:16:24