2011-03-25 251 views
2

我對使用python-django進行自然語言處理感興趣。運行時語法產生創建

我的項目需要在運行時創建語法生成。這意味着,無論何時我問一個問題或寫一個句子,都應該完成像pos-tagging這樣的基本nlp步驟,並將它們添加到語法生成或任何其他結構中(即使這些單詞不存在於語法中),以便我可以從這個語法中分別進一步分解和提取不同的名詞,動詞等。

請引導我一樣。

+1

你到目前爲止嘗試過什麼?什麼工作?什麼沒有?什麼工作比你預期的不同? – Piskvor 2011-03-25 11:05:07

+0

我能夠做POS標記,NP組塊,提取名詞。例如,我寫了自己的語法:電影中的演員是誰?我的語法由N-> actor |電影組成,v->是,Det-> who | ..我也得到了所需的輸出。但我不想僅僅把這個侷限在我的語法產物上。即使我編寫隨機單詞(不存在於語法中),我應該可以執行nlp處理。我寫的語法主要是因爲我的輸入關鍵字也可能由印地語或馬拉地語組成。 – Aditi 2011-03-25 11:21:14

回答

1

NLTK是最流行的用於NLP處理的Python框架,因爲我知道它可以執行POS標記,深度解析並允許您根據這些輸出編寫提取規則。