gate

    0熱度

    2回答

    我目前正在嘗試編寫JAPE規則,可以從原始研究文章中識別評論。 假設我想突出顯示一個短語,例如「在本評論中我們將討論...」,「評論總結..」等。 現在我有: Phase: Review Input: Token Options: control = appelt Macro: REVIEWTERM ({Token.string ==~ "[Rr]eview"} | {Token.st

    0熱度

    1回答

    我對JAPE語法有很大的麻煩。對於需要與5種類型的文檔匹配的單詞,我有一個小的令牌字典。 一種字典適用於一種類型:例如作業,該人的字典將包含{ "Engineer" , "Doctor", "Manager"}。我需要閱讀這本字典,爲此創建JAPE規則。這是我第一次嘗試 階段:JOBTITLE 輸入:查找 選項:控制= appelt調試=真 Rule: Jobs ( {Lookup.major

    0熱度

    1回答

    我正在處理對Python中AppStore評論的分析。我從給定的評論中生成了我想要保存的句子位置,例如(60:75)。我必須這樣做,因爲我的文件奇怪的XML格式。 現在,當我想收集他們,我找到了一些編碼問題的位置漂移。我發現問題出現在特殊字符(例如一些西班牙字母 -/xC3)中。 我想擺脫他們,但支持相同的字母的位置和長度的句子。例如將「é」更改爲「e」。 dropbox.txt - 附有評論文本

    0熱度

    1回答

    的一個工作示例我一直在試圖瞭解如何在位於gate.corpora.DocumentJsonUtils的GATE中使用JSON導出器。有人可以提供一個工作示例嗎?我不太確定在哪裏可以找到或如何構建所有方法所需的Map<String,Collection<Annotation>> annotationsMap。

    1熱度

    1回答

    我正在學習使用Gate從文檔檢索信息。有人能請我解釋一下爲了讓我的JAPE語法規則起作用我必須做些什麼。我已經檢查了大多數教程和門手冊,但我仍然沒有明白。我想提取人員,地點和日期作爲我的命名實體。 因此,我所做的是:1。 鑑定我的約會模式中的文件 2.創建每個模式 3.裝載.jape文件戲言語法規則到門作爲一個新的戲言傳感器 我的日期模式如下: 1. DateMonthYear 2. MonthY

    1熱度

    2回答

    我想從java中使用GATE SUMMA。我正在嘗試運行教程中包含的文件。我已經單獨下載了ANNIE和SUMMA插件。我不明白的是配置中的這一部分。 Gate.init(); // you have to register the plugins from GATE you want to use Gate.getCreoleRegister().addDirector

    3熱度

    1回答

    我正在嘗試構建一個基本上必須做名稱實體識別(NER)的NLP應用程序。我遇到了GATE。從我所瞭解的是構建NLP應用程序的框架。我測試了ANNIE,這是與GATE一起發佈的IE系統,但是我的域名的NER結果並不符合預期。事實上,像斯坦福CoreNLP或NLTK這樣的NER,都不會給我所需的結果。所以我決定調整現有的系統以獲得期望的結果。 關於GATE我喜歡幾件事情: 1.組件的模塊化:例如在ANN

    0熱度

    1回答

    在GATE中,ANNIE的默認值在初始化過程中設置,但有時根據需要進行更改。 我的要求:我想提取英文句子而不考慮「下一個字符」,但「句號」給出正確的句子。爲此,我需要在ANNIE的SentenceSplitter中更改transducerURL的默認值。 這可以通過兩種方式來完成: 使用ANNIE_with_defaults.gapp - 在Sentencesplitter改變initParams

    0熱度

    1回答

    我試圖在JAPE中創建規則。 ANNIE正在確定電子郵件ID。我試圖識別所有的標記,它們是電子郵件ID的子字符串。例如: 例如:以下是具有電子郵件ID([email protected])和其他文本(「cd x」)的文檔示例。 ANNIE NE Transducer將電子郵件ID標記爲kind=email我試圖識別所有其他標記,它們是電子郵件ID的子字符串。這裏cd和x是電子郵件id令牌的子串的令

    0熱度

    1回答

    我如何可能以結構化的方式從文檔中檢索帶註釋的文本,如下所示。我正在使用一個句子作爲處理單元,這意味着我想從句子中檢索特定的文本,並在稍後將它們放在一起。因此,我已經在GATE中設置了我的註釋,並將註釋的結果保存爲內聯xml。 所以我的XML輸入文件看起來像這樣: <Document> <Paragraph> <text id="100">30.03. Zeraua joi