0
我正在構建數據可視化,並且我想將CSV用作我的基本數據格式以實現輕鬆和易用性。我的源數據是沉重的XML,所以我使用Python和lxml將其轉換爲CSV。用XML表示CSV:處理子標籤的建議
我的問題是這樣的。當我在XML中的多個子標籤,像<City>
標籤如下所示:
<Country>
<Name>France</Name>
<Cities>
<City><Name>Paris</Name></City>
<City><Name>Lyon</Name></City>
</Cities>
</Country>
<Country>
<Name>Germany</Name>
<Cities>
<City><Name>Berlin</Name></City>
<City><Name>Munich</Name></City>
<City><Name>Aachen</Name></City>
</Cities>
</Country>
我應該如何代表他們在我的CSV文件?我可以考慮兩種選擇。首先是增加一列的每一個城市,最多CityN:
Country,City1,City2,City3
France,Paris,Lyon,,
Germany,Berlin,Munich,Aachen
二是使用數組用於所有的城市:
Country,Cities
France,[Paris,Lyon]
Germany,[Berlin,Munich,Aachen]
這可能是最好的格式,只是取決於關於我如何查詢數據,但我想我會在這裏查看是否有一個行之有效的或更好的方法來做到這一點。
謝謝,那也是我的想法。然後,我必須將字符串反序列化到客戶端的數組中,但考慮到其他優點,我認爲這沒關係。 – flossfan