可怕的程序員在這裏。對於課堂作業,我必須從文本文檔中提取文字,對它們進行計數並對它們進行排序。我無法擦除標點符號,並用較低的字母替換大寫字母。任何指導將不勝感激。刪除標點符號和大寫字母時遇到問題? (初學者)
docwords={}
doc=raw_input("Please enter the name of a text file: ")
docread=open(doc, 'r')
doclist=[]
def main():
for x in docread:
words = x.split()
for word in words:
doclist.append(word)
def wordcount():
main()
for counter in doclist:
docwords[counter] = docwords.get(counter,0) + 1
wordcount()
docread.close()
for p in sorted(docwords):
print p, "-->", docwords[p]
在標準庫中有一個「計數器」類,可以用來進行單詞的實際計數。 –