2016-07-15 280 views
0

我打算使用Corenlp來評論一些亞馬遜評論,但是,我等了6個多小時,沒有產生任何輸出。CoreNLP運行速度太慢

1. the review is about 1MB; 
2. the cluster has 12CPU, 64G memory; 
3. the command is 
java -cp "*" -Xmx64g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,ner,sentiment -outputFormat json -file amazon_apple_comments_4.csv 

發生了什麼事?它太慢了嗎?

回答

0

這對於1Mb文檔來說太慢了。嘗試運行較少的註釋器來縮小哪一個花費最多的時間。 tokenizessplit註釋器應該非常快; pos有點慢,但不壞; nerpos慢,但在亞馬遜的1億美元評論中,它不應該找到許多命名實體。我從來沒有使用過sentiment,但我認爲它不平凡。