我正在研究一個數學問題解決器,並希望將所有問題傳遞給使用JAPE的GATE嵌入式應用程序。我使用GATE IDE來顯示輸出,以及運行GATE組件的管道。每個問題都將在其自己的段落中,每個文檔都會有幾個問題。LAP中的JAPE可以匹配段落註釋嗎?
有沒有辦法使用JAPE左側正則表達式匹配任何段落?
我正在研究一個數學問題解決器,並希望將所有問題傳遞給使用JAPE的GATE嵌入式應用程序。我使用GATE IDE來顯示輸出,以及運行GATE組件的管道。每個問題都將在其自己的段落中,每個文檔都會有幾個問題。LAP中的JAPE可以匹配段落註釋嗎?
有沒有辦法使用JAPE左側正則表達式匹配任何段落?
我看到三個選項這裏(可能有更優雅的解決方案):
1)用簡單的規則,如:
Phase: find
Input: Token
Options: control = once
Rule:OneToken
(
{Token}
)
在RHS你可以得到一個文本,並使用標準的Java方法從純文本越來越段落。
2)使用LHS(如果你真的想只LHS)
Rule: NewLine
(
({SpaceToken.string=="\n"}) |
({SpaceToken.string=="\r"}) |
({SpaceToken.string=="\n"}{SpaceToken.string=="\r"}) |
({SpaceToken.string=="\r"}{SpaceToken.string=="\n"})
):left
構建註釋換行,然後寫類似1戲言規則),但換行,而不是令牌。從outputAS獲取所有NewLines並構建段落註釋。
3)有時在原始標記中可能有正確的段落。在這種情況下,您可以使用Annotation Set Transfer PR並將它們置於Default Annotations Set中。
爲什麼不只是使用RegEx Sentence splitter PR在您的jape規則中使用Split
作爲Input?