2012-05-01 52 views
1

綜觀PROC包我有點困惑響應和預測器:PROC包來計算AUC

響應:響應的一個因素,數字或字符向量,通常具有0 (對照)編碼和1(例)。物體。 ROC 曲線中只能使用兩個類別。如果矢量包含兩個以上的唯一值,或者它們的順序可能不明確,則使用級別來指定必須將哪些值用作控件和 大小寫值。

predictor:一個數字向量,包含每個觀察值。有序因子是 強制爲數字。

例如,如果我使用:

AUC(響應,預測)

是響應真理,預測什麼我的模型產生?

我的'真相'是0或1,預測向量包含概率。

回答

4

你似乎有(幾乎)正確說明。 ROC曲線所提供的答案是,如果真相已知,則可以預期正面或負面準確度的程度。然而,最後一句話是不正確的,你提供的答案是a)答案,b)從你的模型而不是概率測量或得分。在特定病例和對照的不同層次的臨界值生成一系列表格後,軟件應該返回並繪製敏感性和特異性的補充。

最具信息含義的ROC圖將標出ROC曲線上的截斷值。當我使用那個包時,沒有這樣的標籤,我就是Seder去搜索其他包。

+0

關於這個問題,我的分類器產生的試驗值(0或1像真值,我認爲這些被稱爲假設值),也是每個試驗的得分。所以,對於每個試驗,我都有:真實值,預測值和預測分數。如果我想使用pROC,輸入是什麼?所以,我知道反應是真值,但我不知道預測值是預測值還是預測值。在使用預測分數的情況下,我們應該給程序決定是否屬於TP或FP? – hora

+0

您應該使用示例數據發佈問題。 –

+0

好的。所以請考慮我的問題:) – hora