2015-07-01 20 views
0

我是R的初學者。所以,我對我的問題的標題感到困惑。對不起。我想解釋..R中的多個變量之間的匹配

教授給了我一個NetCDF大氣數據文件(18.3MB)。這個文件有8個維度和8個變量。我必須使用4個變量。每個變量(time,site number,urban site,pm10)有683016個數據。假設,

Urban site number:[2,5]

site number:[1,2,3,4,5,6]

time:[1-3-2012,2-3-2012....](每小時的數據(24)已經採取的每一天),

pm10:[1,2,3,4,5,6.......]

(與一些缺失值的每個小時的數據不同)

我必須管理這個數據集只適用於城市站點和1-3-2012(實際上我必須將這個時空數據轉換爲空間數據)。 我希望我的最終數據是這樣的:

Colum 1(time): 1-3-2012,1-3-2012,1-3-2012,1-3-2012,1-3-2012,1-3-2012 

colum 2(Urban site number): 2,2,2,5,5,5 

colum 3(pm10 value):1,2,3,NA,4,5, 

正如我只知道的R非常基本的命令,所以我不能明白,我怎麼能解決這個問題。即使我不承受責任如何在互聯網上找到這類問題的例子。

所以,請給我一些建議或鏈接關於我必須學會在R中解決這個問題。請幫助我嗎?

+0

首先你必須讀取數據。參見'ncdf4'包。 –

+0

我已經使用ncdf包讀取數據。數據是一維數組的形式.. – Orpheus

回答

0

我認爲你正在嘗試重塑數據集,但恐怕我看不到你當前的數據集是什麼樣子。

您能否詳細說明您的數據集現在的樣子?

有一些軟件包可以幫助重塑,例如{重塑}或{plyr}。但我需要更多的細節來建議你應該使用哪一個。

+0

非常感謝您的關注。由於這是一個netCDF數據文件,我不知道看到這個數據集的完整視圖。我使用ncdf包來檢索這些信息: [1] 「文件2012_03_05_PM10_surface.nc有8個變量:」 [1] 「INT TMSID [DATA_NUM] LONGNAME:TMSID Missval:-999」 [1] 「INT TIME [NCL1] LONGNAME:TIME Missval:NA」 [1]「float PM10 [data_num] Longname:PM10 Missval:-999」 [1]「float city [ID_LAT_LON,obsnum_urban]姓:城市Missval:9.96920996838687e + 36」 如果你想我可以提供完整的數據文件..請讓我知道 – Orpheus

+1

歡迎來到StackOverflow!請發表您的意見,而不是答案。您只有在確定您的答案能夠解決問題時才應提供答案。 – BICube