我有一套用於機器學習的加權特徵。我想減少功能設置,只使用那些體積非常大或非常小的設備。如何找到「最佳」截止點(閾值)
因此,如下給出的排序權重圖像,我只想使用權重高於或低於黃色下限的特徵。
我正在尋找的是某種斜率變化檢測的,所以我可以放棄所有的功能,直到第一個/最後斜率係數增大/減小。
雖然我(想我)知道如何自己編碼(使用第一和第二數值導數),但我對任何已建立的方法感興趣。也許有一些統計或索引計算類似的東西,或者我可以從SciPy中使用的任何東西?
編輯: 目前,我使用1.8*positive.std()
爲正,1.8*negative.std()
爲負閾值(快速和簡單),但我不是數學家足夠,以確定如何健壯,這是。不過,我認爲這不是。 ⍨