2013-07-19 72 views
3

我有一個包含許多不同字符的字符串,我希望能夠通過unicode中[Po]類別中的所有字符拆分字符串。由unicode類別拆分字符串

我該如何輕鬆做到這一點(即,我想避免枚舉列表中的所有字符,然後創建一個巨大的字符數組,然後分裂)?我也會想象這些角色存儲的方式有共同的屬性,這會讓這更容易。

那麼,我怎樣才能通過所有的unicode標點符號分割字符串?

回答

3

Po類是supported by the .NET regular expression engine,所以你可以簡單地這樣做:

Regex.Split("this,is.a!test", @"\p{Po}") // [ "this", "is", "a", "test" ] 
+0

不是隻標點符號等? – soandos

+0

@soandos正確,它只是那個Unicode類別。 –

+0

但是Ps,Pi,Pf,Pe等呢? – soandos