imputation

    0熱度

    1回答

    我想使用mids類對象來計算羣集健壯標準錯誤。這是由於我原始數據的一列中缺少值的多重插補。下面是一個簡單例子。 library(mice) y <- c(1,0,0,1,1,1,1,0) x <- c(26, 34, 55, 15, 31 ,47, 97, 12) z <- c(2, NA, 0, NA, 3 ,7,7, 5) mydata <- as.data.frame(cbind(y

    0熱度

    1回答

    我正在使用來自UCI的此數據集breastcancer,但它包含缺失值。任何人都可以幫我解決它嗎?我是ML新手,對丟失值技術我不太瞭解。這裏是數據集cancerdata的鏈接。 我試着讀該代碼: data <- read.csv('D:/cancer.csv', header=FALSE) # Reading the data for(i in 1:ncol(data)) { dat

    -1熱度

    1回答

    我有一個簡短的問題: 我使用MICE包中的多重插補算出了項目數據。 插補後,我想總結項目總分。 但是,我的數據現在處於mids對象中,我無法弄清楚如何完成這個簡單的任務。 有沒有人有這個「問題」的經驗? 最佳,萊昂哈德

    0熱度

    1回答

    我在回顧R中的多重插補方法,並且遇到了一個根本性但重要的問題。在下面的腳本中,服務於數據[4:10,3] < - rep(NA,7)?它是否告訴R重複NA七次? library(mice) library(Amelia) library(mi) library(missForest) library(Hmisc) library(mi) data <- airquality dat

    -2熱度

    1回答

    我有一個形狀的數據幀2701x128它有很多缺失的值。事情是有些行可以有95%的填充數據,有些只有5%。讓我試着想象它: X軸是行(後排序)的數量,y軸是非零值的數量(排序,直方圖等) X - 軸是(後排序),y軸顯示,非零的專欄中有多少在所有行(排序的,直方圖等) 我需要的列數:我需要儘可能準確地輸入數據,因爲這是我需要解決的問題。 問題:我不能使用均值,中值和其他統計時刻對所有內容進行插值,因

    0熱度

    1回答

    我正在對一系列有序變量進行缺失值插補。 我第一次在數據幀中讀出,並做一些清潔: dietgp1m<-read.csv(file='1 Month data-diet.csv',header=TRUE,na.strings=c(""," ","NA",".")) for (i in 1:ncol(dietgp1m)) {dietgp1m[,i]<-as.factor(dietgp1m[,i])}

    1熱度

    1回答

    比方說,我有一個簡單的數據幀: import pandas as pd df = pd.DataFrame.from_dict( { 'foo': [0.00, 0.31, 0.45], 'bar': [1.00, 0.55, 3.01], 'qux': [0.30, 4.10, 2.78] }, orient = '

    -1熱度

    1回答

    以我分類問題,一些功能(〜5)中85層的特徵具有大多空值(> 90%)。我如何處理這些值?難道我, 1)忽略這些列/功能完全 2)嘗試,如果是如何歸咎於這些值? 3)的任何其他方法? 我開始用隨機森林,我是一個新手,以這種方法,並隨機森林自行處理空值?我怎樣才能實現這個?隨機森林如何做到這一點?我在哪裏可以瞭解到這一點 - 任何參考將非常受歡迎。 在此先感謝。

    0熱度

    1回答

    我試圖用對應於行df [row,'avg']和列('impute [col]')平均值的偏移量來置換Null值。有沒有辦法做到這一點,使該方法與.map並行?或者是否有更好的方法遍歷包含空值的索引? test = pd.DataFrame({'a':[None,2,3,1], 'b':[2,np.nan,4,2], 'c':[3,4,np.nan,3], 'avg':[2.5,3

    0熱度

    1回答

    我一直在研究R-bloggers上的How to perform a Logistic Regression in R教程,其中使用了Kaggle Titanic challenge的數據集。所有帖子中的代碼都可以在here找到。爲891名乘客都包含在這組數據(891行)和177 數據已經丟失Age值: 有訓練數據集存在丟失的數據 type missing method model