2013-02-20 77 views
1

我在我的項目中使用Standford Core NLP, 我正在執行解析,Pos標記,Ner,近100個句子的COREF分辨率。 但它消耗的時間太多。減少Standford corenlp的執行時間?

如何使用線程來減少Standford coreNlp的執行時間?

+4

*「如何使用線程來減少Standford coreNlp的執行時間????」*不確定,但添加了四個'?'不會更快地產生答案。 : -/ – 2013-02-20 16:50:32

+0

你打電話給CoreNLP?你有沒有一個腳本調用命令行中的每一位,並且每次爲每個句子重新加載模型,或者你是否在一次加載API調用並將這些模型保存在內存中? – dmn 2013-02-25 20:24:26

回答

0

僅當使用線程有助於將工作負載分解爲獨立任務。不知道這是否可能。如果是,請查看ExecutorService

1

最新版本的CoreNLP採用命令行參數-threads N。我已經成功地使用它來加速執行。我相信它一次處理多達N文件,因此,如果數據全部位於單個文件中,則不會看到任何加速。

+0

是啊即時通訊使用單個文件only.Any如何如何在日食中使用N選項 – user1925337 2013-04-01 15:09:01

+0

@mbatchkarov,是時間量線性保存到no。線程?從理論上講,它應該是正確的,因爲文件的大小相同,每個句子的長度幾乎相等。 – alvas 2013-06-13 15:45:06

+0

@ 2er0模型被反序列化後,是的。這很慢,所以確保只做一次。 – mbatchkarov 2013-06-13 17:39:06