outliers

    0熱度

    1回答

    我有8個變量(X1,X2 ... X8)的數據幀 我想使用獲得的箱線圖的離羣值: boxplot(dataframe, plot=FALSE)$out 我的期望輸出是讓數據框列出每個變量的異常值。具體如下: variable outlier x1 outlier1 from x1 x1 outlier2 from x1 x1 outlier3 from x1 x1 outlie

    1熱度

    1回答

    我有一個名爲「價格」的變量,其分佈看起來確實偏斜。我正計劃使用核密度估計來檢測異常值。這個有什麼好點子? 謝謝!

    3熱度

    2回答

    我有一個132 x 107的數據集,它由2個病人類型(病人1的33個)和(99個病人2)組成。 我在尋找離羣所以我已經運行1號4種成分的數據集和done qqplots PCA,使用以下命令 pca = prcomp(data, scale. = TRUE) plot(pca$x, pch = 20, col = c(rep("red", 33), rep("blue", 99))) 當我使

    1熱度

    1回答

    也許這是一個簡單的問題,但我想確保我瞭解LIBSVM實現單類支持向量機的概念基礎,如果我在做什麼是允許的。 我使用在這種情況下異常檢測和清除一類支持向量機。這用於更大的時間序列預測模型作爲數據預處理步驟。也就是說,我有一個Y向量(這是我們試圖預測的量,是連續的,不是類標籤)和X矩陣(用於預測的連續特徵)。由於我想探測在預處理步驟早在數據異常值,我還沒有正常化或滯後X矩陣在預測中使用,或者在這方面消

    1熱度

    1回答

    我在WEKA中使用了SimpleKmeans類,所以我也做了聚類實例。但在獲取異常情況期間,我遇到了問題。我認爲,這個類中的每個簇都有一箇中心(或質心),並且半徑爲,所以我可以通過檢查所有簇的質心和半徑來找到異常值。儘管我找不到任何可以獲取羣集半徑的變量或函數。 現在,您是否知道在WEKA的SimpleKmeans課程中發現異常值的其他方法?或者任何顯示每個羣集半徑的變量?

    1熱度

    1回答

    我在R的faoutlier程序包中使用forward.search進行了異常值分析,但這樣做太長而沒有任何結果。我只是想檢查一下我是否做得對,並且我怎樣才能更快地完成這個過程(例如通過設置參數)。這裏的腳本: library(faoutlier) mydata.girls=read.table('data-girls.txt') model.mydata.girls <- 'F1 =~

    0熱度

    1回答

    任何人都可以爲我提供一個類庫條件隨機字段的C++庫嗎?可用於異常檢測。您referece

    0熱度

    1回答

    我有一個有18列和大約12000行的數據幀。我想找到前17列的異常值,並將結果與​​第18列進行比較。第18列是一個因子,包含可用作離羣值指標的數據。 我的數據幀是飛碟和我除去柱18如下: ufo2 <- ufo[,1:17] ,然後將3- non0numeric列數值: ufo2$Weight <- as.numeric(ufo2$Weight) ufo2$InvoiceValue <-

    1熱度

    1回答

    我查看了網絡並發現了很多關於抖動和更改異常值形狀的內容,但似乎無法找到有關此特定問題的任何內容。 我想要一個帶有抖動數據點的黑白boxplot - 我可以做到這一點。 我也想改變異常值的形狀。雖然有多個案例的分數爲4,但其中只有一個變成空心圓。 我假設如果一個特定級別的數據點被認爲是異常值,其餘的值將被視爲異常值。 這是一個編碼錯誤還是我錯過了一個統計類的方式? 如果它是一個編碼的東西,我怎樣才能

    -1熱度

    1回答

    @ aL3xa here有一個非常酷且簡單的功能,但是這是一個向量。 我有一個矩陣,並說第2列,是一個變量,我想砍掉異常值和相關的行。有一個包outliers,我想使用它的算法,但他們似乎也是一個向量。有什麼建議麼? 感謝