我試圖創建一個類別(例如,串)中的R用從不同的變量值的變量,並根據特定標準。問題重新編碼變量與字符串
問題
這似乎沒有實際重新編碼數據。我正在改變數據,但我不確定以何種方式。
數據描述
我有一個數據框,以國家月份分析單位爲結構。其中一個變量是governance
,並且是連續的。它的範圍從0.750到4.333。
所採取的步驟
我試圖創造條件,使我創造的治理4個不同的大類標籤分類變量。
這裏是我的嘗試:
syndromes$syndrome_cat <- NA
syndromes$syndrome_cat[syndromes$governance <= 1.645] <- "Category 1"
syndromes$syndrome_cat[syndromes$governance >= 1.646 & syndromes$governance <= 2.541] <- "Category 2"
syndromes$syndrome_cat[syndromes$governance >= 2.542 & syndromes$governance <= 3.437] <- "Category 3"
syndromes$syndrome_cat[syndromes$governance >= 3.438] <- "Category 3"
不幸的是,這不會導致上市不同的值,而是會導致這樣的:
summary(variable)
Length Class Mode
14256 character character
當我檢查數據,我見這個:
head(syndromes$governance)
[1] NA NA NA NA NA NA
我在做什麼錯?
預先感謝您!
請參閱'help(cut)'。您可以削減「治理」並使用新列的結果創建新標籤。 –
我們可能需要您的數據樣本來幫助您瞭解代碼失敗的位置。重新檢查每個列的類型一次 –
謝謝@RichScriven!這工作完美。 – Yasha