2016-02-02 25 views
0

這是我的代碼到目前爲止,這個想法是讓所有的單詞小寫,統計獨特的單詞(不重複的單詞)以及統計次數「叔叔」是在書中鍵入。Python 2.7試圖使這本書文本小寫

word_cnt = 0 

book = open("shunned_house.txt") 
lower = book.lower() 

for line in lower: 
    words = line.split() 
    for word in words: 
    word_cnt += 1 

print word_cnt 

任何幫助將不勝感激。我已經嘗試過這個問題的許多不同變化,並一直停留在這裏。根據本文檔計算的單詞大約爲10700左右。我特別在設置python代碼時遇到了麻煩,無法解決這個問題。

+0

使用'Counter'計數的東西。和'lower = book.lower()'可能不起作用。 'book'是一個文件,而不是一個字符串。此外,你可能需要刪除標點 – njzk2

+0

和你的縮進是錯誤的 – njzk2

+0

好吧我會研究,感謝您的建議 – Staley

回答

1

很肯定這是你想要什麼:

with open('shunned_house.txt') as f: 
    book = f.read().lower() 

words = book.split() 

print len(set(words)) 
print book.count('uncle') 
+0

什麼是精確的!這就是我們應該如何處理新手的方法。好工作 – nehemiah

+0

哇。我絕對是新手,我感謝你的幫助。任何有關資源學習的建議? – Staley

+0

所以「設置」計數獨特的項目和「len」做什麼?其餘的我從閱讀的角度理解,只是不能自己寫... – Staley