轉化CSV數據說我有以下數據格式的csv文件:進行分析和可視化
ID, Name, Gender, Q1
1, ABC, Male, "A1;A2"
2, ACB, Male, "A2;A3;A4"
3, BAC, Female, "A1"
我想將其改造成以下格式,使我的數據虛擬化工具能夠正確地處理它:
ID, Name, Gender, Questions, Responses
1, ABC, Male, Q1, A1
1, ABC, Male, Q1, A2
2, ACB, Male, Q1, A2
2, ACB, Male, Q1, A3
2, ACB, Male, Q1, A4
3, BAC, Female, Q1, A1
在LibreOffice中使用Text to Columns
特徵我可以很容易分開Q1柱A1;A2
到像A1, A2
不同的列,但我停留在轉置和重複的行。
附加信息:
數據通過谷歌的形式被收集,不幸的是Google電子表格存儲用分號分隔狀
A1;A2;A3...
在一個單元選擇題問題的答覆,而我的可視化工具無法看到此基礎數據結構,只把它們當作一個單一的字符串,使得聚合/分組困難。在實際數據(調查結果)我有圍繞5000個條目,每個與需要這樣的處理的多個小區,其將導致大約100,000的條目的表。需要一種自動化轉換的方法。
我用它來分析/可視化數據爲「的Tableau公共」的工具,他們對Excel中的數據整形插件,半自動化such tasks(見確保每行只包含一個數據的),但沒有LibreOffice替代方案。
我也有同樣的需求,也適用於Tableau。我真的很驚訝,也有不適合來回轉換這兩種格式之間的標準工具:交叉/寬<->標準化/長 – 2014-11-16 22:47:18