2017-04-15 18 views
1

我在我的文字下面一行:如何在CoreNLP中的Regexner映射文件中轉義字符?

突變在耳聾(線粒體)修改2基因

我已經試過以下行中我RegexNER映射文件標記耳聾(線粒體)修改2如基因,但他們倆都未能

耳聾(線粒體)修改2基因

耳聾\(線粒體\)改性劑2基因

看來問題是逸出括號字符,因爲它,當我從文本和映射文件刪除括號匹配。在Regexner映射文件中轉義字符的正確方法是什麼?

回答

1

括號獲得由分詞轉化爲:

-LRB--RRB-

所以要:-LRB- mitochondrial -RRB-也該標記生成器會爲每個括號的記號匹配(mitochondrial)

注意。

+0

一如既往的感謝。它匹配,但我在實體中提到:「耳聾-LRB-線粒體-RRB-修飾符2」。有沒有辦法找回「耳聾(線粒體)修飾符2」或我應該自己替換-LRB-和-RRB-? –

相關問題