gate

    0熱度

    1回答

    我是機器學習的新手。當我嘗試通過門進行學習時,它顯示出一些錯誤。學習配置文件如下。 <?xml version="1.0"?> <ML-CONFIG> <SURROUND value="false"/> <FILTERING ratio='0.2' dis='far'/> <EVALUATION method="holdout" runs="2" ratio="0.66"/> <

    1熱度

    1回答

    我開發了一個應用程序,使用Gate開發人員,它應用paum算法,並將結果顯示在名爲「output」的名爲「comment」的註釋的新註釋集中。 然後,我在Gate Embedded上導入了這個應用程序。 但是,使用Gate Embedded生成的「輸出」註釋集沒有任何註釋! 編輯 這是我是如何進行的: ArrayList<Tweet> listTweets = ... ArrayList<Doc

    0熱度

    1回答

    使用PersistenceManager.loadObjectFromFile從光盤加載.gapp文件時,我得到了「線程中的異常」主「java.lang.OutOfMemoryError:Java heap space」錯誤。 我將堆大小增加到了最大值2048M,並解決了問題。 加載一大組.gapp文件時是否有更好的替代方法來解決此問題。

    0熱度

    1回答

    的部分能否GATE批斜塔PR來可靠地識別電子郵件即只是一部分是寫的發件人排除的「組成」部分 報價先前的對話, 簽名 和標題(From,To,Date)。 目前,我認爲問候(「親愛的加里」)和封閉(「親切的問候,約翰」)是組成文本的一部分。 我嘗試過使用一小段手寫的電子郵件和下面顯示的配置進行培訓。作爲屬性,我嘗試了由默認ANNIE生成的註記類型Token,SpaceToken,Split,Date

    2熱度

    1回答

    我想爲ANNIE地名詞典添加一個新的查找列表。一些應該找到的詞語包含冒號;並在註釋的功能(這是在新的mylookup.list定義)還包含冒號,例如: mylookup.lst: Star Wars:Episode I:url=http://example.com 因此,應找到字符串Star Wars:Episode I與url = http://example.com 我將其標註爲已經嘗試

    2熱度

    1回答

    我一直在嘗試在Groovy(使用Eclipse)中構建一個簡單的應用程序,該應用程序調用GATE並打亂了編譯器錯誤 - 幾年前我在GATE用戶面前看到類似的問題,但沒有任何解決方案爲我解決了這個錯誤。 代碼: import gate.* import gate.creole.* import gate.creole.SerialAnalyserController import gate.u

    0熱度

    1回答

    我在一個文本文件中有一組url。對於該文本文件中的每個網址,我想標記包含在該網址中的文本中的實體和關係。 我知道像斯坦福NER,NLTK和GATE這樣的實體標記,它可以執行實體標記。不過,我更關心關係抽取。 爲了提取關係,我正在考慮註釋包含在這些URL中的文本以進行培訓。爲此,我不想做手動註釋。我可以寫出很少的正則表達式來提取我想要的關係,但是這將很難放大。 有沒有一種工具可以指定我想要註釋的內容

    1熱度

    1回答

    我想嵌入到我的Java項目的門。我已閱讀關於如何構建GATE獨立應用程序的GATE指南。但是,我收到很多錯誤,說每個插件(ANNIE,Twitter等)的creole.xml都無法加載。這裏是我的代碼: public class NERGate { public NERGate(){} public static void main(String args[]) throws

    3熱度

    1回答

    我正嘗試在CrowdFlower上使用 GATE衆包插件創建一個工作。我的問題是我根本無法將數據加載到 作業中。我在創建這項工作時所做的工作是: 在PR中創建工作建設者。 右鍵單擊作業構建器,然後選擇創建新的CrowdFlower 作業。這份工作出現在CrowdFlower的工作清單中。 用某些文檔填充語料庫,用一些文檔預處理它們 ANNIE的應用程序,例如,分詞和句子分流 工作建設者添加到語料庫

    1熱度

    1回答

    由於某些原因,我需要在另一臺計算機上安裝Gate。所以我需要將我之前完成的Gate工作轉移到另一臺計算機上。 一切似乎工作正常。我下載法國Treetagger,它運行沒有錯誤彈出。 但是,我不明白爲什麼法語似乎沒有被Gate識別(有些詞有「未知」註釋),而Token.category仍然顯示英語POS而不是法語POS。 例如,對於動詞,我應該有Token.category = VER:pres,但