我需要將句子拆分爲單詞和標點符號,並將em放入列表中,保存它們的順序。如何使用拆分或匹配將句子拆分爲單詞和標點符號?
例如:"Some text here!"
。結果應該是:List(Some, ,text, , here,!)
我正在使用String.split("regex");
對於「分割」,我只能通過單詞或僅通過標點符號來分割文本。
那麼我應該用什麼來同時分詞和標點符號? 預先感謝您。
我需要將句子拆分爲單詞和標點符號,並將em放入列表中,保存它們的順序。如何使用拆分或匹配將句子拆分爲單詞和標點符號?
例如:"Some text here!"
。結果應該是:List(Some, ,text, , here,!)
我正在使用String.split("regex");
對於「分割」,我只能通過單詞或僅通過標點符號來分割文本。
那麼我應該用什麼來同時分詞和標點符號? 預先感謝您。
基於
而且結果應該是:列表(
Some, ,text, , here,!)
它看起來像你想拆就word boundariessplit("\\b")
String data = "Some text here!";
for (String s : data.split("\\b")){
System.out.println("'"+s+"'");
}
輸出:
如果有一些數字呢?這裏有一些text2! 4你? – TheLostMind 2015-03-25 12:37:31
數字屬於單詞。這就像分割非單詞字符的單詞。 – 2015-03-25 12:40:23
現在我只能將字符串拆分爲單詞並將它們添加到列表中。 Like String [] words = sentenseToParse.split(regex);但是我還需要從相同的字符串(包括空格)中獲取非@WORD字符。並將em放置到String [] sentenseParts。這應該是像{字,空間,另一個字,點} – 2015-03-25 12:44:40