我有SPSS數據,這是我不得不遷移到R的數據是大與202列和數千行ř刪除引號
v1 v2 v3 v4 v5
1 USA Male 21 Married
2 INDIA Female 54 Single
3 CHILE Male 33 Divorced ...and so on...
數據文件 包含的變量標籤"Identification No", "Country of origin", "Gender", "(Current) Year", "Marital Status - Candidate"
,我讀了SPSS我的數據用下面的命令
data<-read.spss(file.sav,to.data.frame=TRUE,reencode='utf-8')
列名稱讀作v1,v2,v3,v4
等,但我希望變量標籤作爲數據框中的列名。我用下面的命令找到變量標籤,並將其設置爲名稱
vname<-attr(data,"variable.labels")
for(i in 1:202){vl[i]<-vname[[i]]}
names(data)<-vl
現在的問題是,我必須解決諸如data$"Identification number"
該列,這是不是很漂亮。我想刪除列名稱周圍的引號。我怎樣才能做到這一點?
我懷疑你的列名真的有引號。 R代表字符值IMO。你的colnames的問題是它們包含空格和'(' – 2014-09-21 19:49:19
實際上更多的情況是,所有對「$」的調用確實在第二個參數周圍隱含了引號,但是它們的打印被抑制。「$」函數的語法糖模糊了真正發生的事情,「$」實際上是「[[」,對後面的表達式進行了非標準的評估,每個人都應該花一點時間閱讀''的細節''中的相關部分[[''' – 2014-09-21 22:01:14