2015-04-05 35 views
4

調用data不帶參數的產生的可用數據組的列表,每一個的簡短描述,例如:data()從哪裏獲取數據集描述?

!> data() 
Data sets in package ‘datasets’: 

AirPassengers   Monthly Airline Passenger Numbers 1949-1960 
BJsales     Sales Data with Leading Indicator 
BJsales.lead (BJsales) 
         Sales Data with Leading Indicator 
BOD      Biochemical Oxygen Demand 
... 

我已經寫了包,其中包括在RDA格式的某些數據文件(save()製造)在包的data/目錄中,雖然data()找到它們,但沒有 說明。

!> data() 
Data sets in package ‘datasets’: 

AirPassengers   Monthly Airline Passenger Numbers 1949-1960 
BJsales     Sales Data with Leading Indicator 
BJsales.lead (BJsales) 
         Sales Data with Leading Indicator 
BOD      Biochemical Oxygen Demand 
... 

Data sets in package ‘fbdata’: 

football.d1 
football.e0 
... 

如何包含數據集的描述?

+1

請參閱http://r-pkgs.had.co.nz/data.html(Hadley's R包中的數據章節,其中包括關於記錄數據集的一節)。還有:數據'找到信息的地方:_如果沒有指定數據集,數據列出可用的數據集。它在'Meta'中查找新樣式的數據索引,或者如果找不到,則在每個指定包的'data'目錄中查找舊樣式的'00Index'文件,並使用這些文件準備列表。如果有'數據'區域但沒有索引,則用於加載的可用數據文件將被計算幷包含在列表中,並且會給出警告:這些軟件包不完整_ – hrbrmstr 2015-04-05 12:05:38

+0

我之前閱讀過這篇文章,但是我沒有找到有關具體的細節這些文件的格式。現在我試圖在數據目錄中放置一個00Index文件,但它似乎沒有任何區別。 – 2015-04-05 13:30:18

回答

2

使用?promptData,或相應的roxygen2標記,生成Rd文件爲您的數據集的骨架,然後適當地編輯添加說明,然後重新生成包...

由於@hrbrmaster點上面,如果你真的想破解的數據描述,你可以做這樣的事情(例如爲plyr包):

datadesc <- file.path(.libPaths()[1],"plyr","Meta","data.rds") 
r <- readRDS(datadesc) 
r 
##  [,1]  [,2]              
## [1,] "baseball" "Yearly batting records for all major league baseball players" 
## [2,] "ozone" "Monthly ozone measurements over Central America." 
r[1,2] <- "hacked description" 
saveRDS(r,datadesc) 

...但我沒有實際測試過這一點。

我不知道你的設置是什麼,但我認爲從長遠來看,實際上重新構建和定期重新安裝軟件包實際上更安全一些(你不想更改版本號以便您可以輕鬆地告訴用戶有權訪問哪些數據版本?)而不是以這種方式破解它...

+0

是否無法手動執行?我打算在安裝軟件包後生成數據文件*。我知道這種方法是非正統的,但由於數據每週更新一次,所以我沒有其他辦法。我無法每週重建這個軟件包。 – 2015-04-05 12:35:33