2013-10-14 63 views
0

實際上,我試圖用java編寫我自己的程序,以便POS標記一組文本文件。我已經搜索了可用的NLP工具,並發現GATE是用於文本處理的最好的NLP工具之一。我想先下載它,然後我不想使用GUI。我期待在我自己的java程序中使用它。在java中使用GATE庫(Netbeans)進行POS標記

所以

  1. 我怎麼能GATE和Netbeans之間的連接?
  2. 如何在我的代碼中使用語音識別?

我是新來的NLP和GATE。我只是在幾個小時之前開始。但我是文本挖掘領域的博士生,我想處理一些NLP工具,因爲我在學習中需要它們。我希望你能幫我找到關於如何在GATE和java之間進行集成的任何教程,以便使用這些庫以及我們如何使用它們。

謝謝您的時間和注意事項

回答

1

最好的輔導材料是從正規培訓課程講義,這些都可以在http://gate.ac.uk/wiki(查找最新的「培訓課程的學員維基」)。特別是模塊5講述了從Java代碼調用GATE API。

我不想使用GUI。我期待在我自己的java程序中使用它。

即使您不想在您的生產系統中使用GUI,我們始終建議您在GUI中設置並測試管道,以便開始使用。當你滿意的時候,它做你想做的事,然後你使用「保存應用程序狀態」或「爲GATECloud.net導出」來保存應用程序,然後你的代碼可以使用PersistenceManager.loadObjectFromFile加載完全配置的流水線,而不必先加載正確的插件,然後手動組裝管道組件。

+0

感謝您的評論和回答....對不起,我有一個關於「管道」的一般問題它真的意味着什麼?對不起,因爲我在這個領域是新的,所以我不知道太多.. 謝謝,我希望我能從你那裏得到更多有用的信息... –

+0

@QusaiRamadan「管道」是我們用於序列的名稱一個接一個地處理文檔的組件。例如,對於POS標記,您首先需要Tokeniser將文本分成單詞,一個句子分隔符將令牌分組爲句子,然後是實際的POS標記器將標記分配給標記。 –

+0

謝謝......我現在正在進行GATE的安裝過程,我會仔細閱讀您發給我的信息。我希望我們能保持聯繫,因爲我看到你對這個主題有很好的背景。我希望你能與我保持聯繫。 感謝您的時間和注意事項 –