2013-09-01 13 views
0

我在尋找一個簡單的正則表達式匹配相同的字符以不同的風格正在鍵入,如:احمد - أحمدإحمد - آحمد正則表達式匹配相同的字符鍵入正在用不同的風格

這個詞有可以以不同形式鍵入的字符。

謝謝你提前。

+1

您正在使用什麼語言或工具? –

+2

枚舉正則表達式中字符變體的unicode代碼點。如果至少有一個表示由charactres序列組成,請使用交替操作符('|')來包含所述變化。 unicode代碼點的規範取決於您使用的工具,常見習語是'\ u <代碼點爲4個十六進制數字>'和'\ x {<代碼點爲1-4個十六進制數字>}。 – collapsar

回答

0

您可以使用下面的表達式匹配:احمد - أحمد إحمد - آحمد

/[\x{627}\x{625}\x{623}\x{622}]\x{062D}\x{0645}\x{062F}/u 

我假設你正在使用PCRE的味道,如果你使用的是不同的味道,那麼你應該看看如何使用您的口味來指定Unicode代碼點和你需要通過哪些修飾符來傳遞正則表達式引擎,以便處理Unicode。

Regex 101 Demo

+0

謝謝,我認爲這將是最好的 –

+0

@FabriGadAhmed我已經爲你工作,那麼請接受答案。 –

+0

如果你喜歡Sniffer,我可以如何獲得PHP中任何字符的unicode,但不是ORD('$ str'); –

相關問題