我有一個熊貓數據框,包含以下領域展開像場:在大熊貓數據幀
ID TYPE_01 TYPE_02 SPRITE
1 12 8 [Image]
2 11 9 [Image]
3 9 nan [Image]
4 3 12 [Image]
5 8 nan [Image]
TYPE_01和TYPE_02是在圖像分類,我會嘗試使用機器學習方法進行分類(我我正在使用sklearn)。 SPRITE包含一個64x64 HSV圖像,我將用於訓練方法。
我想在PCA分解中使用一個尺寸(#記錄,64 * 64 * 3)的大2D矩陣中的圖像,但我遇到了一些問題。我設法使用for循環遍歷每個記錄,但我認爲這可能有點低效(我分配了一個新數組,並通過記錄扁平圖像來分配記錄)。
有沒有更好的方法來做到這一點使用熊貓/ Numpy?如果使用df.values.shape
得到數據幀的形狀,我會得到一個(#Records,4)
,所以對整個數據幀進行簡單的平坦化,拆散或重塑對我沒有幫助。
我看了一些類似的問題行this one,但他們並不適用於這種情況。
精靈3d numpy數組? – James
是的。它們是(64 x 64 x 3),並且在所有記錄中具有相同的維度。 – hemagso