所以我有一個文本文件,其中有一首來自羅密歐和朱麗葉戲劇的動作1的劇本,我想指出有人說了多少次單詞。如何根據名稱將文本文件中的單詞添加到字典中?
以下是全文:http://pastebin.com/X0gaxAPK
有3人在講文:格雷戈裏,桑普森和亞伯拉罕。
基本上我想爲三位演講者分別製作3個不同的詞典(如果這是最好的方法?)。用字詞分別填充詞典,然後統計整個腳本中每個單詞的多少次。
我該怎麼做呢?我想我可以計算出字數,但我對如何區分誰說什麼並將其分成3個不同的字典給每個人都有點困惑。
我的輸出應該是這個樣子(這是不正確的,但爲例):
Gregory -
25: the
15: a
5: from
3: while
1: hello
etc
在數量是這個詞的頻率在文件中說。
現在我編寫的代碼可以讀取文本文件,去除標點符號並將文本編譯到列表中。我也不想使用任何外部模塊,我想以老式的方式學習,謝謝。
你不必發佈確切的代碼,只是解釋我需要做什麼,並希望我能弄明白。我正在使用Python 3.
您可能需要使用字典,其中鍵是名稱和值都像字典你在描述 – JeffS