我正在使用scikit-learn進行分類問題以預測勝利或失敗的機會。
我使用的一段代碼:如何在scikit-learn中解釋roc_curve(測試,預測)
fpr, tpr, thresholds =roc_curve(yTest,predictions)
,其結果是:
(array([ 0. , 0.2628946, 1. ]),
array([ 0. , 0.73692477, 1. ]),
array([2, 1, 0]))
我知道使用FPR計算AUC的,TPR用於各種閾值在範圍內變化的(1, 0)。理想情況下,我知道thresold應該在1和0之間。
但是,這裏的閾值是2,1,0。要從中理解什麼以及如何解釋這一點。
示例代碼看起來罰款:
import numpy as np
from sklearn import metrics
y = np.array([1, 1, 2, 2])
scores = np.array([0.1, 0.4, 0.35, 0.8])
fpr, tpr, thresholds = metrics.roc_curve(y, scores, pos_label=2)
>>>fpr
array([ 0. , 0.5, 0.5, 1. ])
>>>tpr
array([ 0.5, 0.5, 1. , 1. ])
>>> thresholds
array([ 0.8 , 0.4 , 0.35, 0.1 ])
我predict_proba(yTest)爲:
[ 0.09573287 0.90426713]
[ 0.14987409 0.85012591]
[ 0.16348188 0.83651812]
...,
[ 0.13957409 0.86042591]
[ 0.04478675 0.95521325]
[ 0.03492729 0.96507271]
你能分享你的yTest和預測數組中的值嗎? –
@AbhinavArora:編輯我的問題 –