我想創建一個小的類似英語的語言來指定任務。基本的想法是將一個陳述分解成這些動詞應該適用的動詞和名詞短語。我與NLTK工作,但沒有得到我所希望的,如結果:自定義標記與nltk
>>> nltk.pos_tag(nltk.word_tokenize("select the files and copy to harddrive'"))
[('select', 'NN'), ('the', 'DT'), ('files', 'NNS'), ('and', 'CC'), ('copy', 'VB'), ('to', 'TO'), ("harddrive'", 'NNP')]
>>> nltk.pos_tag(nltk.word_tokenize("move the files to harddrive'"))
[('move', 'NN'), ('the', 'DT'), ('files', 'NNS'), ('to', 'TO'), ("harddrive'", 'NNP')]
>>> nltk.pos_tag(nltk.word_tokenize("copy the files to harddrive'"))
[('copy', 'NN'), ('the', 'DT'), ('files', 'NNS'), ('to', 'TO'), ("harddrive'", 'NNP')]
在每種情況下,未能實現的第一個字(選擇,移動和複製),旨在爲動詞。我知道我可以創建自定義標記符和語法來解決這個問題,但同時我很猶豫是否會在很多這些東西超出我的聯盟時重新發明輪子。我特別希望能夠處理非英語語言的解決方案。
因此,無論如何,我的問題是: 有沒有更好的標記這種類型的語法? 有沒有一種方法可以使現有標註器比名詞形式更頻繁地使用動詞形式? 有沒有辦法培訓一個標籤? 完全有更好的方法嗎?
是否有可能使用(在雅各布答案等)的模型和培訓句子(如在此答案)? – Sadik 2015-10-17 13:11:02