2011-06-18 26 views
3

我在尋找RegEx模式以用於保留URL安全字符的rereplace()函數,但包含帶有重音的UTF-8字符。例如:çãURL安全字符RegEx,允許使用UTF-8口音!

類似於:url = rereplace(local.url, "pattern")等我更喜歡ColdFusion唯一的解決方案,但我也願意使用Java,因爲它很容易與CF集成。

我的URL模式將類似於:/posts/[postId]/[title-with-accents-like-ç-and-ã]

+0

你在用什麼語言? –

+0

@Chris Lutz,我正在使用ColdFusion,對不起,我認爲這只是一個使用模式的問題,所以我沒有包含該語言。 – Mohamad

+0

@Chris,我猜它也可能是基於java的! – Mohamad

回答

0

這可以通過使用\w匹配字母數字字符來完成。

rereplace(string, "[^\w]", "", "all")

this answer以供參考。

1

我不知道你用的是什麼語言。 Perl有一些utf8匹配,例如見宮原達彥的URI::Find::UTF8

+0

現在好了,我看到你正在使用ColdFusion,我不知道這會幫助了。 Perl的Regex引擎非常先進(閱讀:與較小引擎不兼容),最新版本(5.14.0)進一步改進了unicode正則表達式。如果ColdFusion的匹配不能幫助你,也許Perl可以。 –

相關問題