1
我想使用NLTK構建pos標籤語料庫。這樣我就可以根據它來訓練我的模型。使用NLTK創建pos標籤語料庫
到目前爲止我已經提到很多來源,但每個人只是解釋如何閱讀你的標註語料和閱讀單詞,句子等,以下是一段代碼,我想:
from nltk.corpus.reader import TaggedCorpusReader
reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_tagged.pos')
reader.words()
reader.tagged_words()
reader.sents()
我想包括我的文集在home/nltk_data/corpora/
文件夾中,以便我可以導入我創建的語料庫。 請指導我。