簡單的問題:如何使Lucene的StandardAnalyzer
不會在分析我的句子時刪除停用詞?如何指示Lucene中的StandardAnalyzer不刪除停用詞?
8
A
回答
11
答案與版本有關。對於Lucene 3.0.3 (current),你需要構造StandardAnalyzer一組空的停用詞,使用這樣的事情:
Analyzer ana = new StandardAnalyzer(LUCENE_30, Collections.emptySet());
6
更新: 答案是依賴於版本。對於Lucene的4.0,使用:
Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_40, CharArraySet.EMPTY_SET);
注意,StandardAnalyzer
不在lucene的核心罐子,但在lucene-analyzers-common-4.0.0.jar
2
對於Lucene的6.0.0,使用
StandardAnalyzer analyzer = StandardAnalyzer(CharArraySet.EMPTY_SET);
相關問題
- 1. Lucene StandardAnalyzer 3.5 TypeAttribute
- 2. StandardAnalyzer - Apache Lucene
- 3. 如何使用lucene的shingleanalyzerwrapper + standardanalyzer + indexreader?
- 4. 如何刪除java中的停用詞?
- 5. 如何覆蓋lucene中的停用詞
- 6. Lucene.NET,StandardAnalyzer,停用詞和線程安全
- 7. 停用詞去除在Lucene的
- 8. 刪除停用詞
- 9. 在Lucene 4.3.0的StandardAnalyzer中使用CharFilter
- 10. Tokenize,使用Lucene和Java刪除停用詞
- 11. Lucene StandardAnalyzer在C#中使用Hunspell TokenFilter?
- 12. Apache Lucene 6.2 StandardAnalyzer版本
- 13. R tm removeWords停用詞不會刪除停用詞
- 14. 如何從文本文件中刪除停用詞而不刪除空格
- 15. 刪除NLTK中的停用詞
- 16. 刪除句子中的停用詞
- 17. 刪除字符串中的停用詞
- 18. Lucene,停用詞過濾器
- 19. 如何在lucene中使用兩個標記器(japaneseanalyzer和standardanalyzer)
- 20. Tika in Action書中的例子Lucene StandardAnalyzer不起作用
- 21. 如何從gensim中的文檔中刪除停用詞?
- 22. 從數據框中刪除停用詞
- 23. 從文件中刪除停用詞
- 24. 在java中刪除停用詞
- 25. 從推文中刪除停用詞Python
- 26. NLTK從CSV中刪除停用詞
- 27. elasticsearch:如何刪除停用詞而不是替換它們?
- 28. 從文本中消除停用詞,同時不刪除重複的常規詞
- 29. 如何在java中使用lucene添加自定義停用詞
- 30. 如何使用Visual Basic從字符串中刪除停止詞?
是這麼想的..等待有人會說「API中有東西可以這樣做」:)我想我會和你的答案一起去:) – Shrinath 2011-02-24 12:38:19
不要忘記標記答案是正確的! – Joel 2011-02-24 13:24:28
@Joel,@Yuval:接受了答案:)也upvoted :) – Shrinath 2011-02-25 04:25:46