Stanford NLP Parser Model Jar太大

我使用maven來管理依賴關係。我需要使用Stanford NLP Parser來獲得英語句子的普遍依賴關係。我正在使用edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz模型。我的pom.xml包含以下Stanford NLP Parser Model Jar太大

<dependency> 
     <groupId>edu.stanford.nlp</groupId> 
     <artifactId>stanford-parser</artifactId> 
     <version>3.6.0</version> 
    </dependency> 
    <dependency> 
     <groupId>edu.stanford.nlp</groupId> 
     <artifactId>stanford-parser</artifactId> 
     <version>3.6.0</version> 
     <classifier>models</classifier> 
    </dependency>

通過增加模型的依賴，由300MB左右的罐子尺寸的增加。我需要確保罐子儘可能小。有沒有辦法在maven中處理這個問題？

來源

2016-10-13 Sneha

您可以通過不包含模型和從其他地方引用它們（即，指定屬性parse.model的自定義路徑）來縮小該jar，但是通常如果您想生成分析樹，則需要解析器模型可訪問某處。 CoreNLP默認將它包含在模型jar中，以便使代碼獨立於特定的目錄結構運行。

另一種選擇是運行CoreNLP服務器，然後您只需要客戶端庫（服務器包含模型jar）。

來源

2016-10-14 01:52:04

Stanford NLP Parser Model Jar太大

回答

相關問題