我試圖導入一個巨大的數據集(稍後做分析),但我只想要4行(它們按實用程序分類,而我只對在其中幾個)。大型數據集問題(250MB)中的R加載
問題是:該格式是奇怪的和巨大的,我不斷收到有關沒有足夠的列名稱的錯誤。
格式如下:每行是一個公用事業區域,每一列從2015年夏季到現在每一小時,以及其用電量,所以有很多列(2015年至今的小時數x 2)。
我已經試過如下:
> data<-read.table("C:\\Users\\EBA.txt",header=true,nrows=150)
Error in read.table("C:\\Users\\EBA.txt", :
object 'true' not found
> data<-read.table("C:\\Users\\EBA.txt",header=TRUE,nrows=150)
Error in read.table("C:\\Users\\EBA.txt", :
more columns than column names
> data<-read.table("C:\\Users\\EBA.txt",header=TRUE,sep=",")
#cancelled here because it froze my computer
> data<-read.table("C:\\Users\\EBA.txt",header=TRUE,sep=",]")
Error in scan(file, what = "", sep = sep, quote = quote, nlines = 1, quiet = TRUE, :
invalid 'sep' value: must be one byte
> data<-read.table("C:\\Users\\EBA.txt",header=TRUE,sep=",")
Error in read.table("C:\\Users\\EBA.txt", :
more columns than column names
我期待在這裏的生活(「美國電力系統運行數據」的數據集,https://www.eia.gov/opendata/bulkfiles.php「
最終,我會想使用日期和用電量,所以閱讀它的使用形式和ISO時間轉換也將是偉大的 - 謝謝!
'read.table'讀取表格文件,而不是JSON。看看https://stackoverflow.com/questions/2617600/importing-data-from-a-json-file-into-r#2617823 – HubertL
你有意識地使用data.table標記嗎?它在問題主體中似乎沒有任何意義......無論如何,我會繼續並將其刪除。 – Frank
@HubertL我不知道JSONs存在!任何喜歡的軟件包來操縱它們?這種格式非常糟糕。感謝您的幫助。 – mcando