解析出維基百科的IPAc

我想從維基百科的標記如解析出的IPAc模板的內容：解析出維基百科的IPAc

'''Konjac''' ({{IPAc-en|lang|pron|ˈ|k|oʊ|n|j|æ|k}})

魔芋（英語發音：/koʊnjæk/）

'''Konjac''' ({{IPAc-en|lang|pron|ˈ|k|oʊ|n|j|æ|k}} {{respell|KOHN|yak}})

魔芋（英語發音：/koʊnjæk/科恩 - 犛牛）

''Konjac'' is pronounced {{IPAc-en|ˈ|k|oʊ|n|j|æ|k}} in English.

魔芋讀作/koʊnjæk/英文。

我需要什麼正則表達式來提取這個內容|k|oʊ|n|j|æ|k我不知道如何搭配的東西，可能是有，但不一定是（lang|pron）

謝謝

2012-05-04 myro

我想試試這個：

IPAc-en(?:\w|[|])+.(?:[|]|([^}]))+(?:}}\s*{{respell(?:[|]|([^}]))+)?

它應該匹配主要發音以及可選的'respell'的東西。

這兩個pronounciations的匹配將在捕獲組，所以你應該能夠從Java訪問它。

說明：

2012-05-04 19:27:44

回答