2014-02-23 64 views
3

當使用空格分詞器時,會顯示「there,he is」這樣的文本。將被分成 「there」,「he」和「is」。當然,我想刪除標準標記器自動刪除的標點符號。使用空格分詞器時刪除逗號

我的問題是:

  1. 如何修剪這些標點符號? (在elasticsearch設置中,例如添加另一個標記過濾器或charfilter)
  2. 我需要使用空白標記化器,主要是因爲我不想要連字符詞被拆分。有沒有一種方法可以實現這一點,同時仍然使用標準的標記器?

回答

-1

你可以使用split()可以刪除所有標點符號

String str ="there, he is."; 
String[] ss = str.split("[ ,.]"); 
for (String string : ss) { 
System.out.println(string); 
} 

試試這個 這將幫助ü

+0

這不是一個Java問題。 –