missing-data

    1熱度

    1回答

    我有一個關於產品銷售的每日時間系列,我的系列從01/01/2016開始直到2017年8月31日。 考慮到這是一個爲期6天的星期(我的星期從星期一開始到星期六結束),週日沒有數據,我明白在運行Arima模型之前,我需要先填充缺失的值。這是我需要幫助的地方:我讀過我可以使用na.approx或NA填寫缺失的值,但我不知道該怎麼做。 你可以看到我在這裏系列: https://drive.google.c

    0熱度

    1回答

    我有一個不完整的數據框,我想填充缺少的值以匹配組。 incomplete_table <- tibble(id = c(1,1,2,2,3,3,3), value = c("a",NA,"b","b","c","d", NA)) # # A tibble: 7 x 2 # id value # <dbl> <chr> # 1 1 a # 2 1 <NA>

    -1熱度

    2回答

    好吧,所以我有一點困難,我知道它必須有一個解決方案。 我有一個13欄的數據表,但我們只關注兩個(票價和pClass)。有1309行,1308有票價值,並且我想通過基於不同類的平均值(pClass)來找到缺失的值。所以我想要的是告訴R找到一行,其中Fare = NA,讀取pClass(1,2或3)中的值,然後找到指定類別的平均值,然後替換票價中的缺失值與平均水平 所以我想總結你的使命,誰是勇敢和善良

    0熱度

    1回答

    我正在使用撥浪鼓包來做一些數據清理工作,我在數據集中考慮了第一個變量X.當我在第一個選項卡中輸入「Data」選項卡時,它報告了一些基本的數據集,並且它說變量X有1243個缺失值。如果我使用sum(is.na(my_df[,1])),這也是我的價值。 在接下來的選項卡,在「資源管理器」選項卡,當我檢查「摘要」現在說,我剛纔942倍的NA在變量X 我怎樣才能使這些不同的數字感?我通過數據集手動瀏覽了一

    1熱度

    1回答

    我想在R中使用隨機森林包我的數據集,其中包括分類和數值變量以及一些「不需要的coloumns」(我不想將其包括在我的預測變量中)。此外,我的一些理想變量(應該被用作預測變量)缺失。 我該如何處理?

    2熱度

    3回答

    可以說我有,有很多丟失的數據的數據幀: df = pd.DataFrame({'id': ['a','a','b','b','b','c','d','e','e','e'], 'q1': [1,1,np.NaN,np.NaN,0,np.NaN,1,np.NaN,1,0], 'q2': ['low',np.NaN,np.NaN,'high','low','high

    1熱度

    1回答

    在我的數據集中,我有大約40%的缺失值。所以我使用e1071包中的impute()。我用下面的代碼來根據它們的中位數來推算整型變量的缺失值,並通過它們的模式缺少字符變量的值。 library(mlr) imp1 <- impute(obj = as.data.frame(train_prop), target=character(0), classes = list(intege

    3熱度

    1回答

    我有一個DeedleDataFrame類型Frame<int,string>它包含一些缺失的值。我想將缺失的值轉換爲空字符串""。我嘗試使用valueOr函數,但這沒有幫助。有沒有辦法做到這一點? 這裏是我的DataFrame: let s1 = Series.ofOptionalObservations [ 1 => Some("A"); 2 => None ] let s2 = Series

    0熱度

    2回答

    我有一個月的數據框(4月1日 - 4月30日)。按小時收集的數據。我想使用plotNA.distribution創建時間序列圖。問題是,如何將col名稱(標題)設置爲時鐘(00.00 - 23.00)? 0 1 2 3 4 5 6 7 2017年1月4日24,4 26,4 28,1 30,5 29.6 31 NA 30,7 2017年2月4日25,8 27.3 29 ,2 30,1 32,

    0熱度

    1回答

    我是node.js的新手,以及它處理API的方式。 我使用一個API來獲取頗像這 { total: 1, skip: 0, page_size: 10, buy: { total: 1, listings: [ [Object] ], fold: false }, sell: [] } 在buy.listings 數據被認爲是一大陣,有很多的東西,但它