我試圖在印地語字符集中收集所有'o'形狀的Unicode列表。事實上,任何使用單獨的字符表示重音的字符(使用任何語言)的列表都會更好。什麼是印地文重音字符的unicode範圍?
我打算在RegExp中使用這個unicode列表。
我一直試圖通過在輸入文本字段中輸出來編輯字符範圍列表,但編輯此文本會導致出現奇怪的問題(鍵盤光標未放置在正確的字符上,選擇突然消失/不正確翹曲......換句話說...... HINDI HELL!)
我已經用記事本++試過了,但它雖然響應性更好,但它最終還是像我在Flash Player文本框中一樣拖出來了。這似乎特別發生在刪除[]塊(空值?)字符時。其中一些觸發奇怪的行爲。
無論如何,我想要的是一個口音清單。 的幾個例子是在下面的圖片(但我需要的所有口音):
謝謝!
與適當的Unicode正則表達式語言,這將是'[\ p {IsDevanagari} && \ p {M}]'......不幸的是我認爲只有Java(也許Perl)支持這一點。 – porges 2012-03-01 21:17:21
@Porges PCRE用於php。所以如果Perl是正確的,那麼PHP也是。 另請參見:http://www.regular-expressions.info/ – kirilloid 2012-03-01 21:20:57
@kirilloid:PCRE不支持字符類交集,它不支持Perl做的任何事情。 (無論如何,你可以用前瞻來模擬交叉點。)但是...這並不重要,因爲他使用AS。 :) – porges 2012-03-01 21:45:07