2016-07-15 54 views

回答

1

這是一個艱鉅的任務,我不知道有任何工具,這樣做的,但如果你很可能發佈的語料郵件列表上的東西,或reddit的的語言技術部分,您將得到更好的回覆。但如果是一個研究問題,我會建議在penntreebank數據集上訓練一個PCFG,然後用它來計算分配給句子的解析樹的概率。您可以抓取Mark Johnson's實施。搜索這行:

cky.tbz包含一個非常快的C實現一個CKY PCFG解析器, 與提取樹庫PCFGs等,這 在我1999年的文章CL使用的程序在一起。 (最後更新於2006年3月6日)

CYK(維特比)是一種動態規劃算法。 PCFG代表概率性CFG,您通常使用penntreebank數據集進行訓練。對一個句子的所有可能的解析樹的概率的總和可以被解釋爲句子在語法上是正確的。對不起,如果這不是真正的答案,但這是一個工作答案,如果你決定這麼做,我可以告訴你更多細節:)。

相關問題