0
我有我的鳴叫的CSV文件,有以下欄目:R正在讀取鳴叫問題:Created_At是NA
created_at | text | lon | lat
我閱讀本使用:
tweets_df <- read.csv("mytweets.csv", header=TRUE, StringsAsFactors=FALSE)
但是,當我輸入:
tweets_df$created_at
一切都只是NA。
這是相同的「created_at」條目的例子:
Thu Sep 15 23:59:16 +0000 2016
後來我打算將其轉換爲使用這些中的一個更易於管理的格式,但我甚至不能正確讀取它...我在這裏做錯了什麼?
time_format <- "%a %b %d %H:%M:%S %z %Y"
tweet_df$created_at <- as.POSIXct(striptime(tweet_df$created_at, time_format, tz="GMT"), tz="GMT)
但是,是否有誰能幫我弄清楚爲什麼他們只是讀爲NA?
編輯:修復它;需要做到以下幾點:
tweets_df <- read.csv("myweets.csv", header=TRUE, StringsAsFactors=FALSE, fileEncoding="latin1")
fileEncoding =「latin1」修好了!
如果排除「StringsAsFactors = FALSE」,會發生什麼情況? –
同樣的問題,該列仍然有NA(created_at) – shishy
請參閱幫助文件'?strptime'。某些格式說明符(例如'%z')只能用於* output *格式('POSIXt'到'character')。 – nrussell