2017-04-06 67 views
0

我想使用StanfordNLP regexner通過使用字典列表來註釋一些數據。 可惜我不能一個模式中匹配括號,如:如何匹配StanfordNLP regexner中的括號?

"Iq (mA) max" 

在比賽應該是"Iq" or "Iq (mA) max"

我嘗試了不同的正則表達式,如

Iq(\s\(\smA\s\)\smax)? 
Iq(\\s\\(\\smA\\s\\)\\smax)? 

但是毫無效果。它總是匹配"Iq"
任何人都可以幫忙嗎? 正則表達式有可能嗎?

回答

0

你的規則應該被格式化這樣:

Iq -LRB- mA -RRB- max ENTITY MISC 1 

如果你想要的一切後智商是可選的,我覺得最容易做的事情是隻寫只Iq

每一個單獨的規則Regexner規則開始處的空格分隔列表元素是一個匹配TOKEN的正則表達式,因此如果添加問號,則可以使模式中的某些標記爲可選,但我不確定是否有辦法使他們全部可選作爲一個組或不。

+0

嗨,非常感謝!規則中「1」的效果如何?我將通過爲每個添加問號來使所有模式可選,因爲我無法找到任何可以使整個組可選的解決方案。 – maflj