-3
任務是使用機器學習創建垃圾郵件過濾器。爲了進行特徵選擇,我實現了一種計算每個單詞的MI的方法,但是我想返回N個具有高MI的單詞,並根據它們在垃圾郵件中出現的次數選擇它們。用於在Python中排序的容器
附加要求的原因是,我們使用的是小的lingspam集合,結果之間幾乎沒有差異,並且有大約3000個詞共享相同的最高MI值。
我們需要在Python中做到這一點,我目前使用字典來實現這一點,但我找不到容器類型,讓我做我需要的。
啊優秀 - 我沒有意識到使用lambda排序 – Syzorr
它在[Python文檔](https://docs.python.org/3/library/functions.html#sorted)中有更好的解釋: 「* key *指定一個參數的函數,用於從每個列表元素提取比較鍵」 – cyphar