0
試圖對字符串進行規範化並將單詞存儲在字符串數組中,但與省略號(例如Lorem...ipsum
)連接的單詞不能正確分割;得到的數組是[loremipsum, dolor, sit, amet]
。如何使用Java API分割使用省略號連接的單詞
String teststr = "Lorem...ipsum dolor sit amet.";
String nstr = Normalizer.normalize(teststr, Normalizer.Form.NFD)
.toLowerCase().replaceAll("[^a-zα-ωA-ZΑ-Ω0-9 ]", "");
String[] words = nstr.split("\\s+");
System.out.println(Arrays.toString(words));
將替換字符串更改爲「」「'''。 – 4castle
@ 4castle它的工作!一直在嘗試幾個小時使其工作,對正則表達式不太熟悉,感謝您的回答。 –
放下'replaceAll()'並且做'nstr.split(「[^ a-zα-ω0-9] +」)'稍微簡單一點(當你有時你不需要正則表達式中的大寫字母轉換爲小寫)。 –