使用PCRE從字符串中提取尾部

我正在尋找一種PCRE正則表達式匹配模式，可以使用它在C語言中提取字符串的尾部碎片。我的預期效果是提取字符串「en」後面的字符串，該字符串後面可以沒有任何內容，可以使用或不使用斜槓「/」。如果「en」後面的第一個字符是斜線，請在返回捕獲的字符串之前將其忽略或關閉。輸入字符是小寫的純ASCII字符。使用PCRE從字符串中提取尾部

input-string  match captured-string 
--------------------------------------- 
english/japan  no 
en     yes 
en/     yes 
en/japan   yes  japan 
en//japan   yes  japan 
en/japan/tokyo  yes  japan/tokyo 
en//japan/tokyo  yes  japan/tokyo 
en//    yes

預先感謝您！

來源

2013-10-21 Masao Liu

echo "en//japan/tokyo" | sed -rn 's;^en($|/+(.*));\2;p'

來源

2013-10-21 13:17:31

我剛纔測試了'恩/*(.*）'上http://www.freeformatter.com/regex-tester.html 我似乎無法從中得到正確的結果。輸入字符串'english/japan/tokyo'不應匹配，但匹配並返回捕獲的字符串'glish/japan/tokyo'。 –

我剛剛編輯了我的答案，以解決一些錯誤 –

謝謝你的直觀報價！ –

^en(?:/+(.+)|/?)$

^ #beginning of line 
    en #'en' literal 
    (?: #beginning of a not capturing group 
    /+(.+) #'/' one or more times + 'any' character one or more times (capturing group) 
    | # OR 
    /? #'/' zero or one time  
    ) #closing not capturing group 
$ #end of line

來源

2013-10-21 15:55:37 polkduran

感謝您直觀的解釋！我應該提到在捕獲的字符串中出現的前導'/'應該被刪除。給定輸入'en /'或'en ///'，'^ en（？：/ +（。+）| /？）$'捕獲'/'作爲第一個被捕獲的組'$ 1'。所需的結果是空字符串。 –

使用PCRE從字符串中提取尾部

回答

相關問題