2015-11-06 125 views
2

我正在嘗試使用Stanford NLP工具包來評估依賴關係語法。是否可以使用LexicalizedParser類來執行「純粹」依賴關係解析?

是否有可能讓LexicalizedParser類僅使用來自模型文件的DEPENDENCY_GRAMMAR部分的規則?

將模型文件的其他部分留空將導致異常,並且在模型文件中將'doPCFG'標誌更改爲'false'將導致ExhaustiveDependencyParser.getBestScore中的空指針異常。

看來,LexicalizeParser類將依賴(選區)PCFG當它不能使用的相關性規則解析輸入。

這是正確的嗎?此行爲是否可以關閉,以便可以獨立評估依賴關係語法?

回答

2

什麼你要找的是Stanford Dependency Parser,只產生了依賴解析器,而不是一個選區解析。相比之下,詞法分析器只產生一個選區分析,然後將其轉換爲轉換器的依賴分析。因此,沒有選擇不產生這個選區分析,並且仍然產生一個依賴分析,因爲轉換器沒有任何轉換。

如果你只是在做語法形式主義的評價,但是,你可以考慮使用黃金樹的依賴轉換器,或使用新的通用依賴註釋的數據。

+0

我認爲斯坦福依存句法,但它是基於神經網絡的,它的模型由特徵向量,而不是傳統的語法規則。是否有可能加載依賴語法,還是僅僅是對它進行培訓? –

+0

就我所知,就PCFG語法分析器的語法而言,沒有「依賴語法」這樣的東西。我所知的所有依賴關係解析器都具有某種類似的依賴關係arc分類器 - 無論是用於在MST算法中對弧進行評分還是在shift-reduce框架中評分解析操作。神經解析器也不例外;它只是使用神經網絡作爲分類器。 –

+0

當然..我只是想到了LexicalizedParser模型的DEPENDENCY_GRAMMAR部分中使用的那種表示,可以比一個50元素的矢量更容易讀取和評估它。 如:' 「比/ IN」 - > 「領頭羊/ NN」 左0 1.0' VS '綁-0.6479344878343402 0.5893377057407623 1.0174283134652544 0.7000564156722917 -0.004831055643038269 ... ... ... 0.7715736625830979' –