2011-07-05 85 views
9

我對自然語言處理有一些想法。我將需要一些文法的是否發佈了自然語言的生成語法?

S -> NP VP 

品種以便與他們玩。

如果我嘗試自己編寫這些規則,這將是一個單調乏味且容易出錯的業務。 有沒有人輸入和發佈英語和其他自然語言的綜合規則集?理想情況下使用BNF,Prolog或類似語法編寫。

我的項目只涉及上下文無關文法,我對統計方法或機器學習不感興趣 - 我需要系統地產生 Engligh-like和Foobarian-like句子。

如果你知道在哪裏可以找到這樣的物料,我會非常感激。

回答

3

最全面的上下文無關文法的英語,我知道的是中描述的:

加茲達爾,傑拉德; Ewan H. Klein,Geoffrey K. Pullum,Ivan A. Sag。 1985. 廣義短語結構語法。牛津:布萊克威爾。

還有幾種基於規則但無上下文無關的在線免費語法,例如Penn XTAG grammar或HPSG English Resource Grammar

5

您可能想看看Attempto Controlled English及其基於Prolog的工具。

由於統計分析在90年代初流行起來,語法通常不是分佈式的,除了特定的問題域,而是從分佈式語料庫(例如賓州樹庫)派生。如果你能夠得到這樣的結果(我相信一個樣本是通過NLTK發佈的),你可以通過查看所有樹碎片並將它們轉換爲規則來「滾動你自己的」語法。 (例如,如果您發現標記小號有孩子的節點標記NPVP,你知道應該有一個規則小號 - >NP VP修剪不常出現的規則將是一個很好。主意)

+1

+1用於解釋來源的性質 – spraff

1

調查Grammatical Framework。它是一種用於多語言語法應用程序的函數式編程語言,它附帶大約30種語言的庫,其中包括英語。