2016-08-24 39 views
0

我最近發現(閱讀下面的問題),我可以使用NNDependencyParser獲得與斯坦福分析器的德語依賴關係。Stanford-NLP德語依賴分析不能正常工作

Dependencies are null with the German Parser from Stanford CoreNLP

我的問題是,我的分析依賴性總是簡單地相鄰的單詞在句子中,沒有真正的樹結構。解析「Die Sonne Scheint是Himmel。」即使在使用拼湊的依賴關係時,也會得到我作爲依賴項的對(「Die」,「Sonne」),(「Sonne」,「scheint」),(「scheint」,「am」)等。

String modelPath = "edu/stanford/nlp/models/parser/nndep/UD_German.gz"; 
    String taggerPath = "edu/stanford/nlp/models/pos-tagger/german/german-hgc.tagger"; 
    String text = "Ich sehe den Mann mit dem Fernglas."; 

    MaxentTagger tagger = new MaxentTagger(taggerPath); 
    DependencyParser parser = DependencyParser.loadFromModelFile(modelPath); 

    DocumentPreprocessor tokenizer = new DocumentPreprocessor(new StringReader(text)); 
    for (List<HasWord> sentence : tokenizer) { 
     List<TaggedWord> tagged = tagger.tagSentence(sentence); 

     GrammaticalStructure gs = parser.predict(tagged); 

     for (TypedDependency td : gs.typedDependenciesCollapsed()) { 
     System.out.println(td.toString()); 
    } 

回答

0

是的,我們在德國的依存分析模型目前破(被列入釋放莫名其妙的法國模式,我們目前似乎沒有有一個工作的德國模式)。

但是,您可以使用Universal Dependencies project中的數據來訓練自己的模型。你可以在project page上找到一些關於如何訓練解析器的信息。