2014-01-31 20 views
2

如何用ASCII字符組的正則表達式(安卓/ JAVA)如何匹配和拆分正則表達式

實際字符串分割
「我就是我英語孟加拉語」

的預期輸出

我是
孟加拉語英語

+0

可以捕捉團體幫助?我不知道任何 –

+0

通過模式ASCII字符 –

+0

試圖「^ \\ p {ASCII} * $」分裂,但它並沒有幫助 –

回答

2

你總是可以分爲以下幾點:

(?<=[\u0021-\u007E])\s+(?=[^\u0021-\u007E])|(?<=[^\u0021-\u007E])\s+(?=[\u0021-\u007E]) 

這按空白進行分割由標準的拉丁字符前面和後面標準拉丁字符標準拉丁字符後跟一個標準的拉丁字符。當然,你可以修改的unicode範圍看here作爲參考接受。

+0

我要發佈'分裂(」(?<= \\ p {ASCII })\\ S(= \\ p {ASCII})|?(<= \\ p {ASCII})\\ S(= \\ p {ASCII})「)',但你潔具第一?。 +1。 – Pshemo