2017-02-12 37 views
0

我有我的鳴叫的CSV文件,有以下欄目:R正在讀取鳴叫問題:Created_At是NA

created_at | text | lon | lat 

我閱讀本使用:

tweets_df <- read.csv("mytweets.csv", header=TRUE, StringsAsFactors=FALSE) 

但是,當我輸入:

tweets_df$created_at 

一切都只是NA。

這是相同的「created_at」條目的例子:

Thu Sep 15 23:59:16 +0000 2016 

後來我打算將其轉換爲使用這些中的一個更易於管理的格式,但我甚至不能正確讀取它...我在這裏做錯了什麼?

time_format <- "%a %b %d %H:%M:%S %z %Y" 
tweet_df$created_at <- as.POSIXct(striptime(tweet_df$created_at, time_format, tz="GMT"), tz="GMT) 

但是,是否有誰能幫我弄清楚爲什麼他們只是讀爲NA?

編輯:修復它;需要做到以下幾點:

tweets_df <- read.csv("myweets.csv", header=TRUE, StringsAsFactors=FALSE, fileEncoding="latin1") 

fileEncoding =「latin1」修好了!

+0

如果排除「StringsAsFactors = FALSE」,會發生什麼情況? –

+0

同樣的問題,該列仍然有NA(created_at) – shishy

+0

請參閱幫助文件'?strptime'。某些格式說明符(例如'%z')只能用於* output *格式('POSIXt'到'c​​haracter')。 – nrussell

回答

0

需要在read.csv中使用fileEncoding =「latin1」。這解決了它!