7
我有一個扁平文件輸入數據。我想通過將其分解成表格來規範化這些數據。我可以用pandas
整齊地做到這一點 - 也就是說,將平展數據讀入DataFrame
實例,然後應用一些函數以獲得DataFrame
實例?pandas:正常化DataFrame
例子:
數據是給我在磁盤的CSV形式的文件是這樣的:
ItemId ClientId PriceQuoted ItemDescription
1 1 10 scroll of Sneak
1 2 12 scroll of Sneak
1 3 13 scroll of Sneak
2 2 2500 scroll of Invisible
2 4 2200 scroll of Invisible
我要創建兩個DataFrames:
ItemId ItemDescription
1 scroll of Sneak
2 scroll of Invisibile
和
ItemId ClientId PriceQuoted
1 1 10
1 2 12
1 3 13
2 2 2500
2 4 2200
如果pandas
對於最簡單的情況只有一個很好的解決方案(正如在上面的例子中規範化會導致2個表具有多對一的關係),這對我目前的需求來說可能就足夠了。但是,我可能需要一個更通用的解決方案。