r

    -1熱度

    1回答

    我有一個.dta格式的數據集,包含棒球運動員的身高和體重。我想計算每個體重值的平均身高。 從我所能找到的,我可以使用dplyr和「group_by」,但我的R腳本無法識別該命令,儘管已安裝並調用該程序包。 謝謝!

    1熱度

    1回答

    我有一個數據框,每行中包含多個因子,用逗號分隔。各行中的因素數量和因素數量未知。我需要對這一列進行熱編碼,這樣每一個獨特的因素都佔據着自己的專欄。我在下面有一個解決方案,但我相信有一個更好,更優雅的解決方案。這裏是一個例子: #one hot encode multiple factors in each row library(stringr) library(caret) library

    1熱度

    1回答

    象徵是汽車的保險風險評級。 str(carprice$symboling) $ symboling:係數W/6水平 「-2」, 「 - 1」, 「0」,..:6 6 4 5 5 5 4 4 4 3 ... levels(carprice$symboling)[-2:-1] <- "safe" levels(carprice$symboling)[0:1] <- "mild risky" l

    1熱度

    2回答

    我有兩個向量,我想知道向量b的哪個值使a的每個元素的和(a-b)最小。我想要的輸出是一個長度爲a的矢量,其中包含向量b的值。 a <- c(1, 3, 5, 7, 9, 12, 19, 25, 80) b <- c(2, 9, 8.4, 7, 66, 32, 19, 4) 我曾嘗試 - closest_longitude <- function (x, y) { which.min(x -

    -2熱度

    1回答

    我正在處理員工數據。整個數據框有104列,但爲此,我只關心兩列。我們有一個員工編號和他們的主管(以員工編號列中存在的主管編號的形式)。我需要對數據進行排序,以便員工編號在管理員標識列中的任何實例上方。 下面是我的第一個解決方案,但它有幾個問題,我認爲有一個更好的方法來做到這一點。現在,它不僅僅是將行向上移動,而是添加一個新行,所以它永遠不會完成。 任何援助將不勝感激。 library(iterat

    0熱度

    1回答

    我有2個數據框(工資和投球)。薪水(我們發現球員的薪水)有26'000個參賽項目,Pitching(我們發現球員的統計數據)有19'000項。顯然,賺取某些具體統計數據而不僅僅是薪水是相當複雜的,所以這是可理解的。 現在我想添加一個薪金列到Pitching數據框中,但只是匹配的(相同的球員,相同的日期)。我想代碼如 如果球員姓名(來自工資數據框)=球員姓名(來自投球數據框)和年份(來自薪水數據框)

    0熱度

    1回答

    我有兩列Grp和CHD Grp CHD 20-29 0 20-29 1 20-29 0 30-34 1 30-34 0 一個數據幀我想生成這個新的數據幀如下 grp n ChDP CHDA Mean 20-29 10 1 2 0.1 30-35 15 2 13 0.133 其中 grp = grp n = grp計數 CHDP =組 平均數在總(CHD

    -1熱度

    1回答

    我有以下數據集 Call.reason <- c("Binnen zichttermijn", "Buiten zichttermijn", "Reparatie", "dvd hoesjes", "Technische ondersteuning", "Retour koop ongedaan maken", "Digitaal", "Kobo") Count <- c(67452, 4727

    0熱度

    1回答

    我想從聯合國糧農組織網站(http://www.fao.org/countryprofiles/en/)建立一個數據集。 在此頁面中包含一組指向國家的鏈接。 點擊此鏈接的任何一個鏈接將導致包含國家/地區新聞的特定國家/地區的頁面。 這個想法是在數據集包括: Country name Country url (e.g. <http://www.fao.org/countryprofiles/ind

    1熱度

    1回答

    dataframes我正在做一些正態性檢驗兩個dataframes的兩列: # Normality tests shapiro.test(male$height) shapiro.test(female$height) ad.test(male$height) ad.test(female$height) cvm.test(male$height) cvm.test(female