3
我愛Stanford CoreNLP,現在它對我的NLP需求來說非常準確。問題在於分析海量文本(假設句子爲百萬)需要天。斯坦福CoreNLP獲取解析樹更快的替代方案?
是否有替代Java實現犧牲一些精度的效率,同時(理想情況下)提供相同的API?
我愛Stanford CoreNLP,現在它對我的NLP需求來說非常準確。問題在於分析海量文本(假設句子爲百萬)需要天。斯坦福CoreNLP獲取解析樹更快的替代方案?
是否有替代Java實現犧牲一些精度的效率,同時(理想情況下)提供相同的API?
如果您使用的是PCFG或因式分解模型,則可以考慮切換到自版本3.2起可用的新RNN models--它們要快得多。
或者,如果您只需要依賴關係,則可以嘗試其他解析器(例如mate-tools parser或ClearNLP dependency parser)。如果你需要成分,你可以嘗試Berkeley parser。
Afaik,沒有其他解析器實現具有與斯坦福分析器相同的API。但是,有些集合爲不同的解析器提供了一個相當統一的API,例如, DKPro Core或ClearTK。
披露:我是DKPro Core項目的開發人員。
謝謝,我會嘗試RNN模型,並在這裏報告準確性和時間。 – Alphaaa
太棒了!通過從版本1.1.3升級到3.3.1,我的應用程序獲得了1.5x-1.8x的加速,並且準確度略有提高(<1%)。 – Alphaaa