我想創建一個文本中所有唯一字詞的字典。關鍵是單詞,值是這個詞的頻率創建文本字詞典
dtt = ['you want home at our peace', 'we went our home', 'our home is nice', 'we want peace at home']
word_listT = str(' '.join(dtt)).split()
wordsT = {v:k for (k, v) in enumerate(word_listT)}
print wordsT
我希望這樣的事情:
{'we': 2, 'is': 1, 'peace': 2, 'at': 2, 'want': 2, 'our': 3, 'home': 4, 'you': 1, 'went': 1, 'nice': 1}
不過,我收到這樣的:
{'we': 14, 'is': 12, 'peace': 16, 'at': 17, 'want': 15, 'our': 10, 'home': 18, 'you': 0, 'went': 7, 'nice': 13}
很顯然,我濫用功能或做錯事。
請幫助
很好用!謝謝! – Toly
@當然是!很高興我能幫上忙!你應該看看周圍的集合,那裏有很多有用的工具。「計數器」是一個,我也一直使用'defaultdict'。如果你有任何問題隨時問,我會盡力幫助,如果我可以:) –
@JohnRuddell join()返回一個字符串,你爲什麼要把它轉換爲字符串?計數器(''.join(dtt).split())會做 – helloV