我是NLTK的新手,我想爲我的玩具項目嘗試語法分析器。Python NLTK解析標籤文本:如何檢索標籤文本
這裏是我使用的代碼:
tokens = nltk.regexp_tokenize(test_sentence, ptrn_for_tokenizer, flags = flags)
tagged_text = regexp_tagger.tag(tokens)
only_tags = [tag for text, tag in tagged_text]
grammar = CFG.fromstring(GRAMMAR)
parser = nltk.ChartParser(grammar, trace=0)
trees = parser.parse(only_tags)
所以我記號化與regexs的文本,然後使用正則表達式的其他標記我的文本,最後我用解析器有語法樹。但是,解析僅通過標籤(only_tags)完成,我無法恢復標籤文本。
如何做到這一點?這是錯誤的方式嗎?
mhhh ...沒有答案的評論。愚蠢的問題? – robob