2
我正在使用RUTA併爲提取相同的實體寫了很多不同的規則。例如,我將提取「衛生紙工廠」。目前我的規定將導致衛生紙廠,造紙廠和工廠。但我只對最長的比賽感興趣。UIMA Ruta只註釋最長匹配
我創建了一個小例子:
DECLARE Test;
(CW CW) {-> CREATE(Test)};
(CW CW CW) {-> CREATE(Test)};
我的測試字符串:以上
lower lower Upper Upper Upper lower Upper
規則將匹配上上和上上上。但在這種情況下,我只對最後一條規則的結果感興趣。
是否可以刪除較短的匹配?
謝謝:) - 有需要的第一個解決方案特殊技援股的版本?我正在使用2.3.1 第二種解決方案有效 - 但正如您所說的那樣緩慢。 – PascalTurbo
對於第一種解決方案,UIMA Ruta 2.5.0是必需的。您也可以爲2.3.1重寫此規則,例如,使用BLOCK和UNMARK中的類型 –