2016-04-29 104 views
1

當我使用斯坦福分析器來解析像這樣的句子時: 「JiríHubac的劇本是一顆寶石。」 「吸收安德烈·特平的性格研究」。如何解析多語言的句子?

它會引起內部錯誤。

如何處理這種情況,句子是多語言?

回答

1

使用完整斯坦福CoreNLP工具包可以在這裏找到:

http://stanfordnlp.github.io/CoreNLP/

我跑這個命令:

java -Xmx6g -cp "stanford-corenlp-full-2015-12-09/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse -file example.txt -outputFormat text 

它有沒有問題,解析您的例句和輸出可以在被發現file:example.txt.out

您能否提供您發出的命令以及嘗試運行時出現的錯誤在這句話上?

+0

@StanfodNLPHelp我使用[link](https://github.com/dasmith/stanford-corenlp-python)中提供的Python接口,只提供了命令'code server.parse('some sentence')'內聯'反向代碼' – Matthew

+0

我不會使用Python封裝。你可以嘗試使用斯坦福CoreNLP服務器:http://stanfordnlp.github.io/CoreNLP/corenlp-server.html並使用這個Python包裝:https://github.com/smilli/py-corenlp ...雖然我應該注意,如果你只是想處理很多句子,你可以只使用我在os.system()調用中提供的命令,然後處理輸出......如果你使用「-outputFormat json」而不是文本,我們的工具包會輸出處理過的句子的json – StanfordNLPHelp

+0

@StanfodNLPHelp這對我很有幫助。另外,如何從Stanford Parser獲得二進制解析樹?有沒有這個參數?謝謝! – Matthew