2017-07-16 52 views
0

我有一個CSV表持有的電影數據使用這些值:拆分單元格的值到新的列名

MovieID| MovieRating | MovieGenres 

1 | 7 | Action & Adventures

2 | 6.5 | War & Horror

而且爲了與D3對其進行可視化,我想更改表格,使其看起來像這樣:

MovieID|MovieRating| isAction|isAdventures| isWar |isHorror 

1  | 7   | 1  | 1   | 0 | 0 

2  | 6.5  | 0  | 0   | 1 | 1 

可以使用什麼工具而不是實際編寫代碼來更改csv文件?

謝謝!

+0

嗨Itay,歡迎來到SO。要求我們推薦或查找書籍,工具,軟件庫,教程或其他非現場資源的問題都是無關緊要的。請參閱此處的指南https://stackoverflow.com/help/on-topic –

回答

0

想必你知道這些流派的價值。如果是這樣,使用case生成標誌:

select m.* 
     (case when MovieGenres like '%Action%' then 1 else 0 end) as isAction, 
     (case when MovieGenres like '%Adventure%' then 1 else 0 end) as isAdventure, 
     . . . 
from movies m; 

注:這是假設類型是單個單詞不「重疊」。如上所述,「戰爭行動」將分爲兩類。有辦法解決這個問題,但是他們更多地依賴於你沒有指定的數據庫。