2015-06-09 27 views

回答

2

This FAQ answer解釋了長段的差異。相關部分引用如下:

你能解釋一下不同的解析器嗎?

此答案只適用於英語。它主要適用於其他語言,但某些語言中缺少某些組件。文件englishPCFG.ser.gz僅包含非靈活的PCFG語法。它基本上是ACL 2003 Accurate Unlexicalized Parsing論文中描述的解析器。

...文件englishFactored.ser.gz包含兩個文法,並導致系統運行三個解析器。它首先運行一個(更簡單的)PCFG解析器,然後運行一個無類型的依賴關係解析器,然後運行第三個解析器,通過產品模型在兩個其他解析器中找到最佳聯合評分的解析。這在NIPS Fast Exact Inference論文中有描述。

...對於英語,雖然語法和分析方法不同,的englishPCFG.ser.gzenglishFactored.ser.gz平均質量是相似的,所以很多人選擇了速度更快englishPCFG.ser.gz,雖然englishFactored.ser.gz有時做更好,因爲它不包括詞彙。對於其他語言,因子模型比PCFG模型好得多,並且是人們通常使用的模型。

有鏈接到the main parser page上引用的論文。

+0

感謝Jon的簡單解釋 – SvckG

相關問題