編輯:如何格式化(a)CSV文件中的數據以便可以輕鬆導入到R中?
所以,這種格式將工作:
featureID charge xcoordinate ycoordinate
1 2 5105.9217 336.125209180674
1 2 5108.7642 336.124751115092
2 0 2434.9217 145.893331325278
但是如果我有連結多個值兩列。說柱質量有機器和鏈接的質量和列看起來像這樣
MachineQuality
[[{1:1224}, {2:3453}], [{1:2242}, {2:4142}]
現在,如果我想拆分像我與凸形輪廓的座標做我需要2行,而不是1,但不會,我需要2行,每行已在(SO 4,因爲已經有2個額外的座標)是這樣的:
featureID charge xcoordinate ycoordinate quality1 quality2
1 2 5105.9217 336.125209180674 1224 3453
1 2 5105.9217 336.125209180674 2242 4142
1 2 5108.7642 336.124751115092 1224 3453
1 2 5108.7642 336.124751115092 2242 4142
[...]
它會是這樣?
我對R很陌生,我的知識並沒有比知道如何製作矢量和一些簡單的情節更進一步。我將在接下來的幾個月裏使用R進行一個實習項目,在此期間,我將(希望)學習一些R的內容。然而,在我開始之前,我需要產生我的數據去做統計。我需要事先知道如何格式化我的輸出CSV數據,以便在開始進行R分析時可以輕鬆讀取它。
我被要求做的一件事是從數據中提取一個CSV文件,以便它可以被R讀入。用R導入的CSV文件示例我見過都是這樣的
featureID Charge value
1 2 10
2 0 9
但是,我的數據主要是由其值包含多個值的列組成。澄清: 作爲一個例子,我的數據存在「功能」,其中的其他信息具有「凸起」。這個凸包由成對的x和y座標組成。因此,我可能會對數據(只顯示兩個座標,可以是很多)
featureID Charge Convexhull
1 2 [[{'y': '336.125209180674'}, {'x': '5105.9217'}], [{'y': '336.124751115092'}, {'x': '5108.7642'}]]
是否有可能在一個CSV文件中得到這個,能夠R中正確讀取(以便配對的X並保存y座標)?如果是這樣,那麼CSV文件應該如何?例如,我已經看到了這個樣子與多個值CSV文件的示例:
featureID charge xcoordinate ycoordinate
1 2 5105.9217 336.125209180674
5108.7642 336.124751115092
2 0 2434.9217 145.893331325278
但我找不到,如果這很容易被R.
進口如果這不是可行一個CSV文件,是CSV文件輕鬆導入的獨立主鍵思想,如數據庫鏈接?
只是不要在第二行留下'featureID'和'charge'空白;重複值1和2. – joran 2012-02-20 17:07:39
但現在我只包含一列有多個值,如果我有更多,我應該爲每個可能的組合做一個不同的行? – 2012-02-20 17:39:51
我不明白你的評論。也許如果你用一個更充分說明你的觀點的例子來編輯你的問題......? – joran 2012-02-20 18:08:55