1
我想比較像兩個「日期字符串」列:處理data.frame以「日期」一欄,其中包括NULL值
df$inpatient.death = (df$date.of.death==df$date.of.discharge)
但是:NULL
值的出現似乎阻止我從格式as.Date
,以及使用as.character(..)== as.character(..)的不同格式。 什麼是創造
THIS IS THE AIM:
id date.of.death date.of.discharge [ inpatient.death ]
1 1 2012-01-01 00:00:00.000 2012-01-01 [ TRUE ]
2 2 NULL 2012-01-01 [ FALSE ]
3 3 2012-01-02 00:00:00.000 2012-01-01 [ FALSE ]
df <- data.frame(id=1:3, date.of.death=c("2012-01-01 00:00:00.000", "NULL", "2012-01-02 00:00:00.000"), date.of.discharge=c("2012-01-01", "2012-01-01", "2012-01-01"))
什麼是這樣做的最佳方式的最佳途徑?
NULL值從哪裏來?在R中,NA用於缺失值,你的data.frame不應該包含任何NULL值。這意味着你做一些不尋常的事情來創建數據框架,並且應該嘗試去糾正它。另一種可能性是使用'df $ date.of.death [is.null(df $ date.of.death)] < - NA'。 – Roland
請注意,您的示例df只包含一個不是「NULL」值的字符「NULL」。如果你有這些,你應該使用'read.table'的'na.strings'參數或者你用來讀取文件的函數。 – Roland
@Roland:「NULL」來自csv導入,但我後來設法使用as.Date轉換爲as.Date(df $ date.of.death,「%Y-%m-%d 00:00: 00.000" ) – ajo