我得子集數據上的人誰完成了調查,變量爲「處置」的R - 「子集的數據」錯誤:「>」沒有意義的因素
> names(df)
[1] "caseid" "disposition" "regstate" "pid7" "ideo5" "birthyr" "gender" "race" "educ"
> summary.default(df)
Length Class Mode
caseid 708 -none- numeric
disposition 708 factor numeric
regstate 708 factor numeric
pid7 708 factor numeric
ideo5 708 factor numeric
birthyr 708 -none- numeric
gender 708 factor numeric
race 708 factor numeric
educ 708 factor numeric
現在我的子集數據:
disposition <- df$disposition
我可以看到完整的調查是33和708之間
completeSurveys <- disposition[33:708]
我特里結構來選擇以下方式的數據:
selectData <- complete.cases(df$caseid, df$regstate, df$pid7, df$ideo, df$birthyr, df$gender, df$race, df$educ)
,並定義當調查完成的數據:
completeSurveysDat <- (selectData & (df$disposition > 32 & df$disposition < 709))
不幸的是我有:
Warning messages:
1: In Ops.factor(df$disposition, 32) : ‘>’ not meaningful for factors
2: In Ops.factor(df$disposition, 709) : ‘<’ not meaningful for factors
「性格」是一個因素。如果沒有可重現的例子,任何事情都很難診斷。但是,使列'競爭'(df $ complete < - .......)然後通過'mysubset < - df [df $ complete,]'或類似的子集可能更容易。 – Heroka
你爲什麼選擇'處置[33:708]'?通過這樣做,你可以選擇33到708行,你打算做什麼?此外,就像我上面的評論指出的那樣,「處置」不是一個因素。您可以使用'as.numeric(as.character(處置))'將其更改爲數字。 – ytk
我的任務是指文件「sample.RData」,其中包含一個數據框,「df」有708行和9個變量,用於選擇某些人口統計問題的調查回答。我必須將數據分爲完成調查的人員,變量是「處置」 - 完成。 completeSurveysDat < - (selectData&(df $ disposition =「Complete」))generate:plot.window(...)中的錯誤:需要有限'xlim'值 另外:警告消息: 1:In min(x) :沒有非缺少的參數min;使用dplyr返回Inf –