我們目前在斯坦福分析器中使用NNDEP分析器來處理中文數據,期望獲得有用的語法樹。下面是我們用來設置參數:如何在斯坦福分析器中使用NNDEP分析器來處理中文數據
java -cp "./*" edu.stanford.nlp.parser.nndep.DependencyParser -language chinese -model edu/stanford/nlp/models/parser/nndep/CTB_CoNLL_params.txt.gz -tagger.model edu/stanford/nlp/models/pos-tagger/chinese-distsim/chinese-distsim.tagger -escaper edu.stanford.nlp.trees.international.pennchinese.ChineseEscaper -textFile INPUT_FILE
但是,輸出並不像紙Discriminative reordering with Chinese grammatical relations features描述的語法關係相同。如果我們有兩句話:1。我把他打了,2,我打了他,我們得到的結果如下:
SUB(把-2, 我-1)
root(ROOT-0, 把-2)
SUB(打了。-4, 他-3)
VMOD(把-2, 打了。-4)
SUB(打了-2, 我-1)
root(ROOT-0, 打了-2)
OBJ(打了-2, 他。-3)
這類似於從默認的英語語法分析器輸出的結果。
我們參考了手冊並閱讀source code,我們找不到任何線索。因此,有誰能讓我們知道如何設置正確的參數來正確處理中文數據?非常感謝!
你好,請你給我一箇中文例句和你希望看到的解析,我會進一步研究!謝謝! – StanfordNLPHelp
@stanfordNLPHelp感謝您的回覆。如果我們有一個像'我打了他'這樣的句子,我們期望得到一個結果爲'NSUBJ(打了-2,我-1)root(ROOT-0,打了-2)DOBJ(打了-2,他 - 3)「根據中國語法關係論文[與中國語法關係特徵進行歧視性重新排序](http://www.aclweb.org/anthology/W09-2307) – acepor