2013-07-05 37 views
2

對於我的SOLR設置,我可以對其進行配置,以便用戶在數據庫中搜索一些文章時,搜索引擎會對整個正文進行全文搜索。Apache SOLR設計,搜索整個文本字段或只是關鍵字?

但是,我也有代碼,它會對正文進行關鍵字提取。建議只允許SOLR對文章的關鍵詞進行全文搜索,還是讓SOLR對文章主體進行全文提取更好?

我寧願不要這樣做,一個或另一個會很好。我的RAM很有限,只能保留兩個字段之一,關鍵字或文章主體。

推理和答案會很好,謝謝。

+0

我會建議將Solr中需要搜索的任何信息帶入Solr。任何不需要搜索的東西都不一定需要在Solr的索引中。如果你有時需要搜索關鍵字,有時需要執行正確的全文搜索,我會說你需要兩個。這真的取決於你的用例,但我不能告訴你你需要什麼。 – femtoRgon

回答

0

建議只允許SOLR對文章的關鍵詞進行全文搜索,還是讓SOLR只對文章主體進行全文提取?

是的,SOLR在全文索引方面很出色。而不是重新發明輪子(搜索算法,停用詞過濾,提升等)讓SOLR索引數據庫中的內容。如果您需要忽略文章中的某些詞語,則可以在stopwords.txt中配置停用詞。