2013-06-30 55 views
3

我發現Python中的NLKT通過* raw_parse *函數實現,但我需要使用Java。我發現cleartk有一個MaltParser包裝,但沒有關於它的文檔。我正在尋找一種功能或項目,首先將原始英文文本轉換爲MaltParser可以使用的conll文件,並使用MaltParser對其進行分析。任何幫助表示讚賞。用Java中的MaltParser解析原始文本

回答

0

在文件夾示例/ apiexamples/srcex中有一些示例與MaltParser 1.7.2分發。

但是,這些示例僅顯示如何在標記和位置標記已經執行之後(以及這些步驟的輸出已轉換爲類CONLL格式後)以編程方式運行MaltParser。由於我目前無法提供更好的(更簡單/更短的)替代方案,至少我可以與您分享鏈接到Groovy script,該鏈接執行標記化,詞性標註(使用OpenNLP)和依賴分析(使用MaltParser )。這些工具可以使用UIMA進行互操作。如果您熟悉Maven,那麼推導該腳本的Java版本應該非常簡單。

記住,這不是最好的答案,但在這一點上可能比沒有好。

注意:我是Apache UIMA和DKPro Core(鏈接指向的項目)的開發人員。

+0

我相信非那些解析原始文本。他們都採取conll格式化輸入。 – Dana

+1

我該說什麼,你是對的......我愚蠢......爲了在原始文本上運行MaltParser,需要一個標記器和一個詞性標記器。 – rec