當使用空格分詞器時,會顯示「there,he is」這樣的文本。將被分成 「there」,「he」和「is」。當然,我想刪除標準標記器自動刪除的標點符號。使用空格分詞器時刪除逗號
我的問題是:
- 如何修剪這些標點符號? (在elasticsearch設置中,例如添加另一個標記過濾器或charfilter)
- 我需要使用空白標記化器,主要是因爲我不想要連字符詞被拆分。有沒有一種方法可以實現這一點,同時仍然使用標準的標記器?
當使用空格分詞器時,會顯示「there,he is」這樣的文本。將被分成 「there」,「he」和「is」。當然,我想刪除標準標記器自動刪除的標點符號。使用空格分詞器時刪除逗號
我的問題是:
你可以使用split()可以刪除所有標點符號
String str ="there, he is.";
String[] ss = str.split("[ ,.]");
for (String string : ss) {
System.out.println(string);
}
試試這個 這將幫助ü
可以使用炭過濾器消除了「」。 Char Filter
您可以使用:
我已經安裝一個片段̶=̶>̶HTTP:̶/̶/̶e̶s̶.̶s̶u̶b̶i̶t̶o̶l̶a̶b̶s̶.̶c̶o̶m̶/̶#̶/̶t̶e̶s̶t̶r̶/̶m̶6̶m̶f̶b̶4̶a̶h̶i̶m̶8̶6̶w̶2̶9̶
這不是一個Java問題。 –