2011-06-03 21 views

回答

0

我知道(從Lucene的行動),其不屬於一個-ZA-Z或α-ZA-Z具有附加符號的variatons所有字符被用作分隔符,包括數字。
因此,您可能會將Mc'Donald分成「Mc」「Donald」,您可能會將「Web2.0」標記爲「Web」,依此類推。
最好的是做一個測試,並輸入各種字符,然後在這裏發佈你的結果。

+0

謝謝,我可以參考這個信息 – Badr 2011-06-03 09:35:55

+0

對不起,我認爲這是我所描述的SimpleAnalyzer。 StandardAnalyzer更復雜:http://lucene.apache.org/java/3_0_1/api/core/org/apache/lucene/analysis/standard/StandardTokenizer.html – 2011-06-03 11:21:41

+0

嗯,它的作品thanx – Badr 2011-06-03 12:27:09