假設我有100個文件,並遍歷所有這些文件。在每個文件中,都有幾個屬性的記錄:(在讀取所有文件之前未知屬性的總數)用Python生成數據透視表
假設一個簡單的情況,在讀取所有文件後,我們獲得20個不同的屬性,並獲得以下信息:
File_001: a1, a3, a5, a2
File_002: a1, a3
File_003: a4
File_004: a4, a2, a6
File_005: a7, a8, a9
...
File_100: a19, a20
[更新]或者,在另一種表示,其中每一行是一個文件和一個屬性之間的單個匹配:
File_001: a1
File_001: a3
File_001: a5
File_001: a2
File_002: a1
File_002: a3
File_003: a4
File_004: a4
File_004: a2
File_004: a6
...
File_100: a19
File_100: a20
如何可以產生「反向」統計信息表,即:
a1: File_001, File_002, File_006, File_083
a2: File_001, File_004
...
a20: File_099, File_100
如何在Python(2.7.x)中執行此操作? (有或沒有熊貓,我認爲熊貓可能有幫助)
謝謝!它完美的工作!如何將輸出[202]設置爲DataFrame?所以我可以將它導出爲html或csv?結果似乎沒有辦法導出... –
如果我有原始的DF,每行只有一個屬性,例如'File_001 a1'(換行符)'File_001 a2'(換行符)'文件002 a1'等。如何調整複合代碼行以實現期望輸出(也作爲DF)? –
@JimRaynor,我已經更新了我的答案 - 請檢查 – MaxU