0
基本上我有文本文件作爲輸入到NLTK的tokenize.regexp。如何輸入文本文件到下面的代碼:如何將輸入作爲文本文件在NLTK的tokenize.regexp python
'從nltk.tokenize進口RegexpTokenizer
標記生成器= RegexpTokenizer(R' \ W + ')的
原始= doc_a.lower()#instead' DOC_A 「我希望我的文本文件作爲輸入
令牌= tokenizer.tokenize(RAW)`