2
A
回答
0
我知道(從Lucene的行動),其不屬於一個-ZA-Z或α-ZA-Z具有附加符號的variatons所有字符被用作分隔符,包括數字。
因此,您可能會將Mc'Donald分成「Mc」「Donald」,您可能會將「Web2.0」標記爲「Web」,依此類推。
最好的是做一個測試,並輸入各種字符,然後在這裏發佈你的結果。
相關問題
- 1. Lucene:更改默認的facet分隔符?
- 2. 標準分析Lucene的
- 3. Lucene標準分析器vs雪球
- 4. 用分隔符分析字符串「;」 (JAVA)
- 5. Lucene前綴通過標準分析器搜索索引數據
- 6. Java字符串標記器分隔符
- 7. 如何設置用於PhraseQuery搜索的Lucene標準分析器?
- 8. Maven的默認分隔
- 9. LUCENE標準分析儀連字符考慮
- 10. Lucene標準分析儀在時間段上分割
- 11. Lucene中文分析器.NET
- 12. 使用標準分析器在Lucene中獲取精確匹配?
- 13. 使用標準分析器磨砂Lucene搜索術語
- 14. 質量標準中的列分隔符
- 15. Lucene分析器的名字
- 16. Lucene的分析
- 17. Java掃描器分隔符
- 18. Java掃描器分隔符
- 19. Java分隔符閱讀器
- 20. iOS 7自定義分隔符不會模仿默認的分隔符行爲。
- 21. Lucene分析器使用特殊字符和標點符號?
- 22. 解析分隔符分隔值
- 23. 解析CSV文件沒有標準分隔符
- 24. 默認分析器解析哪些字符?
- 25. 如何Elasticsearch設置IK分析所有指標的默認分析5.1.1
- 26. Java拆分分隔符
- 27. edismax語法分析器和默認mm
- 28. Java - 解析多分隔/維字符串
- 29. AWK - 增加一個新的分隔符爲默認的空間分隔
- 30. 無法解析Peg.js分析器中的分隔符
謝謝,我可以參考這個信息 – Badr 2011-06-03 09:35:55
對不起,我認爲這是我所描述的SimpleAnalyzer。 StandardAnalyzer更復雜:http://lucene.apache.org/java/3_0_1/api/core/org/apache/lucene/analysis/standard/StandardTokenizer.html – 2011-06-03 11:21:41
嗯,它的作品thanx – Badr 2011-06-03 12:27:09