我有一個電子表格/ CSV:重塑數據集成多個關係格式(轉置一些行,並將它們分配到數據子集)
Code:,101,Course Description:,"Introduction to Rocket Science",
Student Name,Lecture Hours,Labs Hours,Test Score,Status
John Galt,48,120,4.7,Passed
James Taggart,50,120,4.9,Passed
...
我需要將其重塑以下觀點:
Code:,Course Description:,Students,Lecture Hours,Labs Hours,Average Test Score,Teaching Staff
101,"Introduction to Rocket Science",John Galt,48,120,4.7,Passed
101,"Introduction to Rocket Science",James Taggart,50,120,4.9,Passed
...
無論它與否,不能得到正確的想法儘管它似乎是非常原始的變換,有沒有什麼銀彈? (csv)有一種類似於json的結構,所以我的第一種方法是將原始數據表示爲一個向量,然後將它轉置爲,(但在這種情況下,我的結果表看起來像sparced矩陣 - 我已經轉換的行在它的其餘值中是空的) 另一種方式I m considering - **serialize it into jsons and then de-serialize** into new spreadsheet (jsonize()) - in this case, I
m在正確合併它們時存在問題。
在這兩種方式,我有它「半工作」; 任何人都可以爲此提出簡單可靠的算法; 任何語言,正則表達式,任何工具,代碼片斷非常讚賞
你重塑CSV是怪異:第一行七列和第二隻六隻。 –
結果數據集中的所有行都有7列; – Maxim
在源數據集中,有兩個屬性必須作爲結果數據集中的列添加(代碼和課程描述)。所以在源代碼中有5個列,在結果列中有7個列。 – Maxim