在機器學習包,比如liblinear的分類和NLTK提供了一個方法show_most_informative_features()
,這是調試功能真的有用:如何爲scikit-learn分類器獲取最豐富的功能?
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
我的問題是,如果類似的東西是在scikit學習的分類實施。我搜查了文檔,但找不到類似的東西。
如果還沒有這樣的功能,有人知道如何獲得這些值的解決方法嗎?
非常感謝!
你是指最具歧視性的參數? – Simon
我不確定你的意思是什麼參數。我的意思是最挑剔的功能,如在袋的詞模型的垃圾郵件分類,哪些詞給每個類的最證據。不是我所理解的「設置」分類的參數 - 就像學率等 – tobigue
@eowl:在機器學習的說法,*參數*是通過基於學習過程*特點*你的訓練集產生的設置。學習率等是超參數*。 –