2016-10-13 30 views
0

我使用maven來管理依賴關係。我需要使用Stanford NLP Parser來獲得英語句子的普遍依賴關係。我正在使用edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz模型。我的pom.xml包含以下Stanford NLP Parser Model Jar太大

<dependency> 
     <groupId>edu.stanford.nlp</groupId> 
     <artifactId>stanford-parser</artifactId> 
     <version>3.6.0</version> 
    </dependency> 
    <dependency> 
     <groupId>edu.stanford.nlp</groupId> 
     <artifactId>stanford-parser</artifactId> 
     <version>3.6.0</version> 
     <classifier>models</classifier> 
    </dependency> 

通過增加模型的依賴,由300MB左右的罐子尺寸的增加。我需要確保罐子儘可能小。有沒有辦法在maven中處理這個問題?

回答

0

您可以通過不包含模型和從其他地方引用它們(即,指定屬性parse.model的自定義路徑)來縮小該jar,但是通常如果您想生成分析樹,則需要解析器模型可訪問某處。 CoreNLP默認將它包含在模型jar中,以便使代碼獨立於特定的目錄結構運行。

另一種選擇是運行CoreNLP服務器,然後您只需要客戶端庫(服務器包含模型jar)。