我是python的新手,我需要編寫一個腳本來計算目錄中所有txt文件中的所有單詞。這是我迄今爲止,其他工作時只是打開一個txt文件,但當我進入一個目錄失敗。我知道我需要一個追加的地方,我嘗試了幾種不同的方式,但運氣不錯。Python,通過文件夾中的文件循環並做一個字數
*編輯我希望將結果放在一起。迄今爲止,它有兩個單獨的結果我嘗試製作一個新的清單,並附上計數器。但它打破了。再次感謝,這是一個良好的社區
import re
import os
import sys
import os.path
import fnmatch
import collections
def search(file):
if os.path.isdir(path) == True:
for root, dirs, files in os.walk(path):
for file in files:
words = re.findall('\w+', open(file).read().lower())
ignore = ['the','a','if','in','it','of','or','on','and','to']
counter=collections.Counter(x for x in words if x not in ignore)
print(counter.most_common(10))
else:
words = re.findall('\w+', open(path).read().lower())
ignore = ['the','a','if','in','it','of','or','on','and','to']
counter=collections.Counter(x for x in words if x not in ignore)
print(counter.most_common(10))
path = input("Enter file and path, place ' before and after the file path: ")
search(path)
raw_input("Press enter to close: ")
這是什麼意思「它失敗」?除此之外,我無法在任何地方看到'.txt'限制。 – eumiro 2012-01-31 15:28:44
'如果os.path.isdir(路徑)== True'可以縮短爲'如果os.path.isdir(路徑)' – unutbu 2012-01-31 15:31:28