2016-11-06 37 views
2

我有一個輸入字符串(例如'abcdefgh'),我需要的是用該字符串的一部分(例如'cd')進行註釋,在其他我需要對輸入字符串進行子串處理並用它標記註釋。我怎樣才能做到這一點?UIMA Ruta如何註解輸入字符串的一部分

+0

開發者您可以嘗試一個'(<=^{2}?){2}'正則表達式 –

+0

謝謝您的回答。我嘗試了任何{REGEXP(「(?<= ^。{2})。{2}」) - > MARK(MyAnnotation)},但它不起作用。 –

+0

奇怪的是,文檔說正則表達式是Java。 –

回答

0

新註釋總是隻使用現有註釋的偏移量與正常規則創建。在你的情況下,你匹配ANY類型的註釋,並在每個註解所覆蓋的文本上應用一個條件。該條件與完整文本中的正則表達式匹配,因此條件失敗。

爲了創建小於可用的最小注釋的註釋,例如在標記內,您不能使用正常的UIMA Ruta規則。您需要應用簡單的正則表達式規則,這些規則不依賴註釋來進行匹配過程。這裏有一個例子:

ANY->{"cd" -> MyType}; 

這條規則對每個ANY註釋匹配並應用在每個覆蓋的文本內聯的規則。內聯規則是一個簡單的正則表達式規則,帶有正則表達式cd。如果找到該模式,則在那裏創建MyType類型的新註釋。

如果你這樣做,你應該仔細選擇匹配類型,例如,使用別的東西,但ANY

免責聲明:我的UIMA魯塔