ruta

    1熱度

    1回答

    我更新了我在eclipse中安裝的軟件。更新軟件後,我在運行ruta腳本時遇到了錯誤。新的更新是Apache Uima java sdk 3.0。 0 alpha版本。它是否導致錯誤。 堆棧跟蹤: Exception in thread "main" org.apache.uima.cas.CASRuntimeException: The JCas cannot be initialized. T

    2熱度

    1回答

    問題: 我使用UIMA魯塔(V2.3.1)在我的項目之一,但我現在面臨一個問題: 的內存超出可解釋大小,但無法解決此問題所在的位置,除類別org.apache.uima.ruta.rule.RuleElementMatch外,該內存佔用率高達50%。 我打電話UIMA魯塔的的JavaAPI在我的項目,建立分析引擎。當我發送一個文本以大約400k字節的大小分析到這個引擎時,這個過程會阻塞大約700M

    1熱度

    1回答

    我有一個輸入數字(例如1234567和98765432),我需要得到45(從第一)和54(從第二)到註釋MM,它是5和6的位置。如何在UIMA ruta中做到這一點?

    1熱度

    1回答

    我想寫一些Ruta規則來創建日期周圍的時間註釋。下面的測試顯示了我如何嘗試去做。 @Test public void test__Ruta__AnnotateDate() throws UIMAException, IOException, URISyntaxException { final class RulesRunner { public void applyRul

    1熱度

    2回答

    我想寫一些Ruta規則來捕獲事物之間的'is-a'關係。我有一個Relation類,它包含一個entity1和entity2屬性,它們指向關係中涉及的兩件事情。 我的理解是,我必須用DECLARED註釋「捕捉」這兩個元素,以便稍後將它們設置爲Relation註釋的屬性。 所以我的規則有這樣的: DECLARE Token Thing1; DECLARE Token Thing2; 但不知何故

    1熱度

    1回答

    我已經能夠成功地使用Ruta使用RegExpRule和REGEXP創建註釋。但是,我遇到了一個小塊。我有由另一個引擎創建的註釋,它們分配基本上是註釋的String功能。 STRING featureComment; OtherEngineAnnotation{GETFEATURE("comment", featureComment)}; //featureComment = "some com

    2熱度

    1回答

    MARKONCE:我有一系列以問號結尾的句子,我想一次註釋整個範圍。所以我用MARKONCE來完成這個任務。 現在,我還需要爲這個新創建的註釋設置功能。如何通過MARKONCE設置功能? (以類似於CREATE動作的相同方式允許)。 換句話說,我想有: String testRule = (Sentence{ENDSWITH(QUESTION)})[2,10]{->MARKONCE(Questio

    2熱度

    1回答

    的自體部分 我試圖根據字典來檢測人的名字: 字典開始 David Alberto David Alberto 詞典結束 輸入起始 David Alberto 輸入端 我想anotate 大衛·阿爾貝託作爲人名不大衛或阿爾貝託。 我正在使用以下規則。 WORDLIST FirstNameList = 'en/ruta/dictionaries/FirstNames.txt'; Do

    9熱度

    1回答

    我在Apache Spark上運行UIMA應用程序。有數百萬個頁面進入批處理,由UIMA RUTA進行處理。但有一段時間我面臨內存異常。它有時會拋出異常,因爲它成功處理了頁面,但在頁面上有一些時間失敗。 應用程序日誌 Caused by: java.lang.OutOfMemoryError: Java heap space at org.apache.uima.internal.ut

    0熱度

    1回答

    我讀完了UIMA Ruta official documentation這是非常有幫助的。我想知道UIMA Ruta是否有更多材料可以繼續我的閱讀(和學習)。您能否建議您認爲與此腳本語言相關的任何其他文檔/書籍/論文/網站,並且可能從該特定視圖中提供NLP?到目前爲止,我發現並閱讀了一篇名爲的文章UIMA Ruta:基於規則的信息提取應用程序的快速開發。