我有其他方法需要與我的語料庫中的每個單獨的txt文件一起工作。我怎樣才能在他們之間循環?如何循環遍歷一個語料庫中的文件:Python
import nltk
from nltk.corpus import PlaintextCorpusReader as pcr
def main():
cor = corpus()
# for every text file in the corpus:
#Do this method
def corpus():
corpus_root='corpus/'
corp = pcr(corpus_root,'.*\.txt')
corp = corp.raw()
return corp
main()
你可以在'corpus'中發佈文件結構嗎?另外,你打算如何處理這些文件? – rickcnagy
這是一個nltk問題;從'pcr'的論據中可以清楚地看出結構。 – alexis