2009-10-25 76 views
2

如何在Ruby中按Unicode範圍拆分字符串。我想用逗號分割\ u1000和\ u1000。例如,我想拆分此字符串...用Ruby拆分Unicode字符串

我愛ျမန္မာ

這個...

我的愛,ျမန္မာ

您可能沒有看到我的例子中的Unicode字符。它是Unicode範圍\ u1000以上。

謝謝。

回答

2

取決於您使用的是哪個版本;這裏是1.9的解決方案。我想1.8可能會變得醜陋。

這倒在優雅,但似乎工作。

"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2') 

如果此方法是合適的,你必須提供的其他情況下(高到低轉換)