如何將數據幀列轉換爲數值類型?如何將數據幀列轉換爲數字類型?
回答
由於(仍)沒有人得到複選標記,我假設你有一些實際問題,主要是因爲你沒有指定要轉換爲numeric
的矢量類型。我建議你應該使用transform
函數來完成你的任務。
現在我要證明某些 「轉換異常」:
# create dummy data.frame
d <- data.frame(char = letters[1:5],
fake_char = as.character(1:5),
fac = factor(1:5),
char_fac = factor(letters[1:5]),
num = 1:5, stringsAsFactors = FALSE)
讓我們在data.frame
> d
char fake_char fac char_fac num
1 a 1 1 a 1
2 b 2 2 b 2
3 c 3 3 c 3
4 d 4 4 d 4
5 e 5 5 e 5
都一目瞭然,讓我們運行:
> sapply(d, mode)
char fake_char fac char_fac num
"character" "character" "numeric" "numeric" "numeric"
> sapply(d, class)
char fake_char fac char_fac num
"character" "character" "factor" "factor" "integer"
現在你可能會問自己「異常在哪裏?」好吧,我在R中碰到了很奇怪的東西,這不是最混亂的東西,但它可能會讓你困惑,尤其是如果你在躺在牀上之前閱讀它。
這裏是:前兩列是character
。我特意撥打了2 和一個fake_char
。找出這個character
變量與Dirk在他的回覆中創建的變量的相似性。它實際上是一個numerical
矢量轉換爲character
。 3 rd和4 th列是factor
,最後一個是「純粹」numeric
。
如果您使用transform
函數,則可以將fake_char
轉換爲numeric
,但不是char
變量本身。
> transform(d, char = as.numeric(char))
char fake_char fac char_fac num
1 NA 1 1 a 1
2 NA 2 2 b 2
3 NA 3 3 c 3
4 NA 4 4 d 4
5 NA 5 5 e 5
Warning message:
In eval(expr, envir, enclos) : NAs introduced by coercion
,但如果你對fake_char
和char_fac
做同樣的事情,你會很幸運,並沒有NA的閃避:
> transform(d, fake_char = as.numeric(fake_char),
char_fac = as.numeric(char_fac))
char fake_char fac char_fac num
1 a 1 1 1 1
2 b 2 2 2 2
3 c 3 3 3 3
4 d 4 4 4 4
5 e 5 5 5 5
如果您保存轉化data.frame
和檢查mode
和class
,你會得到:
> D <- transform(d, fake_char = as.numeric(fake_char),
char_fac = as.numeric(char_fac))
> sapply(D, mode)
char fake_char fac char_fac num
"character" "numeric" "numeric" "numeric" "numeric"
> sapply(D, class)
char fake_char fac char_fac num
"character" "numeric" "factor" "numeric" "integer"
因此,得出的結論是:是的,您可以將character
載體轉換爲numeric
載體,但前提是其元素可「轉換」爲numeric
。如果向量中只有一個character
元素,則在嘗試將該向量轉換爲numerical
之一時會出錯。
而只是爲了證明我的觀點:
> err <- c(1, "b", 3, 4, "e")
> mode(err)
[1] "character"
> class(err)
[1] "character"
> char <- as.numeric(err)
Warning message:
NAs introduced by coercion
> char
[1] 1 NA 3 4 NA
而現在,只是爲了好玩(或實習),嘗試去猜測這些命令的輸出:
> fac <- as.factor(err)
> fac
???
> num <- as.numeric(fac)
> num
???
親切問候帕特里克·伯恩斯! =)
如果x
是數據框dat
的列名,x
是類型的因素,使用方法:
as.numeric(as.character(dat$x))
加入'as.character'確實是我在找的東西。否則轉換有時會出錯。至少在我的情況下。 – 2014-11-27 16:36:38
爲什麼需要as.character?我得到一個錯誤:'錯誤:(列表)對象不能被強制鍵入'雙',雖然我有理由相信我的向量沒有字符/標點符號。然後我試着'as.numeric(as.character(dat $ x))'並且它工作。現在我不確定我的專欄實際上是否只是整數! – vagabond 2015-02-26 22:58:30
如果你對一個因子做數字化,它會將這些級別轉換爲數值而不是實際值。因此,as.character需要首先將該因子轉換爲字符,然後再轉換爲.numeric – MySchizoBuddy 2015-07-21 16:06:05
蒂姆是正確的,巴蒂爾有遺漏。下面是更多的例子:
R> df <- data.frame(a = as.character(10:15))
R> df <- data.frame(df, num = as.numeric(df$a),
numchr = as.numeric(as.character(df$a)))
R> df
a num numchr
1 10 1 10
2 11 2 11
3 12 3 12
4 13 4 13
5 14 5 14
6 15 6 15
R> summary(df)
a num numchr
10:1 Min. :1.00 Min. :10.0
11:1 1st Qu.:2.25 1st Qu.:11.2
12:1 Median :3.50 Median :12.5
13:1 Mean :3.50 Mean :12.5
14:1 3rd Qu.:4.75 3rd Qu.:13.8
15:1 Max. :6.00 Max. :15.0
R>
我們data.frame
現在有係數列(計數)和as.numeric()
的數字摘要---這是錯誤,因爲它得到了數字因子水平的總結---和as.numeric(as.character())
的(正確)摘要。
+1感謝您指出這一點。我刪除它。 – Shane 2010-02-18 14:47:22
我的榮幸。這是該語言中較爲愚蠢的角落之一,我認爲它在此處的舊版「R Gotchas」問題中有所體現。 – 2010-02-18 14:52:27
對我有幫助的東西:如果您有多個要變換的變量範圍(或多個變量),則可以使用sapply
。
有點荒謬,但只是舉例:
data(cars)
cars[, 1:2] <- sapply(cars[, 1:2], as.factor)
說6-15列3,和你37數據幀需要被轉換爲數字可能之一:
dat[, c(3,6:15,37)] <- sapply(dat[, c(3,6:15,37)], as.numeric)
as.factor在上面的代碼中使得列字符 – MySchizoBuddy 2015-05-23 00:02:31
sapply比變換更好,當處理向量的索引而不是變量名時 – smci 2015-07-15 01:01:11
@MySchizoBuddy是正確的,至少我的數據是。原來的df不會將「轉換」列作爲因素;他們將保持個性。如果您將'sapply'調用包裝在右側的'as.data.frame()'中,就像@ Mehrad Mahmoudian建議的那樣,它將起作用。 – knowah 2016-06-20 09:30:44
用下面的代碼可以將所有的數據幀列轉換爲數字(X是我們想把它轉換成數據幀中的列):
as.data.frame(lapply(X, as.numeric))
,以及用於將整個矩陣爲你的數字方法有兩種:要麼 :
mode(X) <- "numeric"
或:
X <- apply(X, 2, as.numeric)
或者您可以使用data.matrix
功能一切轉換成數字,但要注意的因素有可能不能正確轉換,因此它是安全的一切轉化爲character
第一:
X <- sapply(X, as.character)
X <- data.matrix(X)
我通常使用這最後一個如果我想轉換爲矩陣和數字同時
雖然其他人已經很好地涵蓋了這個話題,我想添加這個額外的快速思想/提示。您可以使用regexp事先檢查字符是否可能僅包含數字。
for(i in seq_along(names(df)){
potential_numcol[i] <- all(!grepl("[a-zA-Z]",d[,i]))
}
# and now just convert only the numeric ones
d <- sapply(d[,potential_numcol],as.numeric)
對於更復雜的正則表達式和一個整潔爲什麼要學習/體驗他們的能力看到這個非常好的網站:http://regexr.com/
我會添加評論(廣東話較低的等級)
只是爲了加上user276042和pangratz
dat$x = as.numeric(as.character(dat$x))
這將覆蓋現有的列X
012的值要轉換一個數據幀列數字,你只需要做: -
因素數值: -
data_frame$column <- as.numeric(as.character(data_frame$column))
同樣,這個答案不會爲當前的答案組添加任何內容。另外,它不是將因子轉換爲數字的首選方式。請參閱http://stackoverflow.com/q/3418128以獲取首選方式。 – BenBarnes 2015-04-18 08:09:21
更好的答案是:'sapply(data_frame,function(x)as.numeric(as.character(x)))' – 2015-06-30 14:26:49
如果遇到有問題的:
as.numeric(as.character(dat$x))
乘坐看看你的小數點。如果他們是「,」而不是「」。 (例如「5,3」),上述不起作用。
一個潛在的解決方案是:
as.numeric(gsub(",", ".", dat$x))
我相信這是在一些非英語國家相當普遍。
使用type.convert()
和rapply()
通用方式:
convert_types <- function(x) {
stopifnot(is.list(x))
x[] <- rapply(x, utils::type.convert, classes = "character",
how = "replace", as.is = TRUE)
return(x)
}
d <- data.frame(char = letters[1:5],
fake_char = as.character(1:5),
fac = factor(1:5),
char_fac = factor(letters[1:5]),
num = 1:5, stringsAsFactors = FALSE)
sapply(d, class)
#> char fake_char fac char_fac num
#> "character" "character" "factor" "factor" "integer"
sapply(convert_types(d), class)
#> char fake_char fac char_fac num
#> "character" "integer" "factor" "factor" "integer"
這是最靈活的解決方案 - 值得一些upvotes! – 2016-07-05 03:09:17
應該是最佳答案。如果要將字符轉換爲數字或因子,請刪除'as.is = TRUE' – qfazille 2017-11-20 09:41:23
嘗試將具有類型爲「矩陣」的data.frame中的一堆列更改爲數值更改'classes = matrix'首先出錯參數必須是模式字符 – 2018-02-07 17:33:41
在我的電腦(R v.3.2.3),apply
或sapply
給錯誤。 lapply
效果很好。
dt[,2:4] <- lapply(dt[,2:4], function (x) as.factor(as.numeric(x)))
儘管您的問題嚴格依賴於數字,但在開始R時有很多轉換難以理解。我將致力於解決方法以提供幫助。這個問題類似於This Question。
類型轉換可能是R中的一個痛苦,因爲(1)因素不能直接轉換爲數字,它們需要首先轉換爲字符類,(2)日期是您通常需要處理的特例與分開,(3)跨數據幀列循環可能會非常棘手。幸運的是,「tidyverse」解決了大部分問題。
此解決方案使用mutate_each()
將函數應用於數據框中的所有列。在這種情況下,我們想要應用type.convert()
函數,它可以將字符串轉換爲數字。因爲R喜歡因素(不知道爲什麼),應該保持字符的字符列變成因子。爲了解決這個問題,mutate_if()
函數用於檢測因素並更改爲字符的列。最後,我想展示如何使用lubridate將字符類中的時間戳更改爲日期時間,因爲這對於初學者來說通常也是一個障礙。
library(tidyverse)
library(lubridate)
# Recreate data that needs converted to numeric, date-time, etc
data_df
#> # A tibble: 5 × 9
#> TIMESTAMP SYMBOL EX PRICE SIZE COND BID BIDSIZ OFR
#> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
#> 1 2012-05-04 09:30:00 BAC T 7.8900 38538 F 7.89 523 7.90
#> 2 2012-05-04 09:30:01 BAC Z 7.8850 288 @ 7.88 61033 7.90
#> 3 2012-05-04 09:30:03 BAC X 7.8900 1000 @ 7.88 1974 7.89
#> 4 2012-05-04 09:30:07 BAC T 7.8900 19052 F 7.88 1058 7.89
#> 5 2012-05-04 09:30:08 BAC Y 7.8900 85053 F 7.88 108101 7.90
# Converting columns to numeric using "tidyverse"
data_df %>%
mutate_each(funs(type.convert)) %>%
mutate_if(is.factor, as.character) %>%
mutate(TIMESTAMP = as_datetime(TIMESTAMP, tz = Sys.timezone()))
#> # A tibble: 5 × 9
#> TIMESTAMP SYMBOL EX PRICE SIZE COND BID BIDSIZ OFR
#> <dttm> <chr> <chr> <dbl> <int> <chr> <dbl> <int> <dbl>
#> 1 2012-05-04 09:30:00 BAC T 7.890 38538 F 7.89 523 7.90
#> 2 2012-05-04 09:30:01 BAC Z 7.885 288 @ 7.88 61033 7.90
#> 3 2012-05-04 09:30:03 BAC X 7.890 1000 @ 7.88 1974 7.89
#> 4 2012-05-04 09:30:07 BAC T 7.890 19052 F 7.88 1058 7.89
#> 5 2012-05-04 09:30:08 BAC Y 7.890 85053 F 7.88 108101 7.90
考慮到可能存在的字符列,這是基於@Abdou在Get column types of excel sheet automatically答案:
makenumcols<-function(df){
df<-as.data.frame(df)
cond <- apply(df, 2, function(x) {
x <- x[!is.na(x)]
all(suppressWarnings(!is.na(as.numeric(x))))
})
numeric_cols <- names(df)[cond]
df[,numeric_cols] <- apply(df[,numeric_cols],2, as.character) # deals with factors
df[,numeric_cols] <- sapply(df[,numeric_cols], as.numeric)
return(df)
}
df<-makenumcols(df)
要轉換字符的數字你必須把它轉換成因子應用
BankFinal1 <- transform(BankLoan, LoanApproval=as.factor(LoanApproval))
BankFinal1 <- transform(BankFinal1, LoanApp=as.factor(LoanApproval))
必須使兩列具有相同的數據,因爲一列不能轉換爲數字。如果你做一個轉換它提供了以下錯誤
transform(BankData, LoanApp=as.numeric(LoanApproval))
Warning message: In eval(substitute(list(...)), `_data`, parent.frame()) : NAs introduced by coercion
這樣,做同樣的兩個數據列後申請
BankFinal1 < transform(BankFinal1, LoanApp = as.numeric(LoanApp),
LoanApproval = as.numeric(LoanApproval))
它會轉換角色,成功的數字
如果數據幀具有多種類型的列,則某些字符,某些數字會嘗試將以下僅將包含數值的列轉換爲數字:
for (i in 1:length(data[1,])){
if(length(as.numeric(data[,i][!is.na(data[,i])])[!is.na(as.numeric(data[,i][!is.na(data[,i])]))])==0){}
else {
data[,i]<-as.numeric(data[,i])
}
}
- 1. 如何將數據幀的字符列轉換爲Posixlt型
- 2. 將具有列表類型列的數據幀轉換爲平坦數據幀
- 3. 將列轉換爲數字類型
- 4. 如何將數據幀的所有列轉換爲字符串
- 5. 將Pandas列轉換爲數據幀
- 6. 將數據幀轉換爲字典
- 7. 如何將nvarchar數據類型轉換爲數字
- 8. 將數據幀行轉換爲新的數據幀列R
- 9. 將N個數據幀轉換爲3個列數據幀
- 10. 如何將數據行字段轉換爲泛型類型?
- 11. 如何一次轉換多個spark數據幀列類型?
- 12. 如何將寬時間序列數據幀轉換爲長數據幀?
- 13. 將數據幀列值轉換爲數字編號
- 14. 如何將特定的數據幀列轉換爲列表?
- 15. 轉換因子列在數據幀數值類型列
- 16. 轉換類型的字典列表的熊貓數據幀
- 17. SQL - 將數據類型數字轉換爲數字時出錯。
- 18. 如何將表列轉換爲另一種數據類型
- 19. 轉換熊貓數據幀類型
- 20. cocoa:如何將整數類型轉換爲字符串類型?
- 21. 將數據幀轉換爲numpy數組?
- 22. 將包含列表的R數據幀列轉換爲數據幀列
- 23. 如何將Java字符串轉換爲MySQL數據類型?
- 24. 如何在插入時將字段轉換爲數據類型
- 25. 如何將名詞synset數據類型轉換爲字符串?
- 26. 如何將字符串轉換爲自定義數據類型
- 27. 如何將字符串轉換爲Char(20)sql數據類型
- 28. 如何將float數據類型轉換爲字符串
- 29. 如何將數據類型字符串轉換爲文件?
- 30. 如何將數據類型轉換爲可讀的字符串
'stringsAsFactors = FALSE'對於在數據文件中讀取時很重要。 – 2015-02-19 06:49:56
我知道這是舊的...但...爲什麼你選擇變換()通過df $ fake_char < - as.integer(df $ fake_char)?在R中執行相同的操作有多種方式,並且我很難理解這種「正確」的方式。謝謝。 – ripvlan 2016-07-27 17:50:17