2016-02-12 84 views
2

作爲一個R新手,我拉着我的頭髮試圖調試神祕的R錯誤。我有csv包含150k行,我加載到一個名爲'日期'的數據框。然後我使用lubridate將這個字符列轉換爲日期時間,希望找到最小/最大日期。查找不能在R中解析的日期Lubridate

dates <- csv[c('datetime')] 
    dates$datetime <- ymd_hms(dates$datetime) 

運行這段代碼,我收到以下錯誤信息:

Warning message: 
3 failed to parse. 

我接受這個作爲CSV可能在有一些janky日期和下次運行:

min(dates$datetime) 
max(dates$datetime) 

兩者的這些返回NA,我假設它來自仍然存儲在數據幀中的少量分解日期。我搜索了一個快速修復,甚至嘗試構建一個foreach循環來識別問題日期,但沒有運氣。什麼是確定3個破損日期的簡單方法?

example date format: 2015-06-17 17:10:16 +0000 
+0

您可以檢查格式是否一致。同時檢查'?guess_formats' – akrun

+1

如果你在日期時間向量上排序,那麼NA是在頭還是在尾? – lawyeR

+0

@akrun我試圖通過導入csv在excel中執行此操作,並檢查每個單元格的長度並過濾出任何不合適的內容。這沒有任何結果,有沒有辦法在R中做到這一點?我試過guess_formats&parse_date_time,都失敗了。 –

回答