如何使用應用StandardTokenizer
,LowerCaseFilter
和EdgeNgramFilter
來索引文檔?使用StandardTokenizer,LowerCaseFilter和EdgeNgramFilter使用Lucence 5.2.0(最新)的索引文檔
回答
試試這個
<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EdgeNGramFilterFactory" minGramSize="1" maxGramSize="15" side="front" />
</analyzer>
</fieldType>
與Java
public TokenStream tokenStream(String fieldName,
Reader reader) {
TokenStream result = new StandardTokenizer(reader);
result = new StandardFilter(result);
result = new LowerCaseFilter(result);
result = new EdgeNGramTokenFilter(result, Side.FRONT,1,20);
return result;
}
檢查這個link
謝謝,但我需要在lucene而不是solr。我需要使用lucene – iNikkz
java代碼中的示例。下面提到的鏈接可能會有幫助。分析儀分析儀=新分析儀(){ @Override受保護的TokenStreamComponents createComponents(String fieldName,Reader reader){ Tokenizer source = new StandardTokenizer(VERSION,reader); TokenStream filter = new LowerCaseFilter(VERSION,source); 返回新的TokenStreamComponents(source,filter); } }; [https://lingpipe-blog.com/2014/03/08/lucene-4-essentials-for-text-search-and-indexing/] – vinod
- 1. 使用SolrJ索引文檔
- 2. 使用Cloudera索引PDF文檔搜索
- 3. 定期使用lucene將新文檔刷新到索引
- 4. 使用映射創建索引時的ElasticSearch異常(嵌套5.2.0)
- 5. SolrJ - 使用ContentStreamUpdateRequest異步索引文檔
- 6. 使用solrj索引FTP文檔
- 7. 使用websolr爲索引文檔
- 8. 使用pylucene索引文檔時出錯
- 9. 如何使用NEST更新ElasticSearch索引內的現有文檔?
- 10. 新Python文檔中使用的搜索引擎是什麼?
- 11. 如何使用NEST更新ElasticSearch索引內的現有文檔?
- 12. 重新索引SOLR文檔
- 13. 最新文檔使用Python包裝gobjects
- 14. Lucene更新文檔索引
- 15. twitter如何通過使用lucence改進他們的搜索?
- 16. 文檔和索引/ Memcache - 如何使用GCE或GKE?
- 17. 使用pg_search和GIN爲大文檔編制索引
- 18. 如何使用Lucene.NET索引Word 2003,2007和2010文檔
- 19. 如何使用StandardTokenizer從Lucene的5.x.x
- 20. 使用ODM和ZF2搜索其他文檔的文檔
- 21. 使用CUDA 7.0與GCC 5.2.0和C++ 11
- 22. Lucene.NET獲取最近索引的文檔
- 23. 使用FluentMongo刪除和更新文檔
- 24. 使用mongoDB和mongoHQ更新文檔
- 25. 使用文檔根引用文件
- 26. IFilter是使用Lucene.NET索引全文文檔所必需的
- 27. 如何使用elasticsearch索引epub,pdf文檔的文件夾
- 28. 文檔索引Asp.net
- 29. 未能使MongoDB文檔過期使用TTL索引
- 30. Solr部分文檔索引更新
5.2.0不是Lucene的最新版本。 6.0.0是。 – femtoRgon