2017-08-28 110 views
2

我有一個場景,我需要創建Web應用程序的用戶vs頁面視圖矩陣。從CSV表創建User-PageView矩陣表

數據的格式爲:

Page Name  UserName  Count of Page Views by The User 
Home   David   12 
Home   Minerva   56 
Home   Michael   1112 
Buy    David   2 
Buy    Mike   12 

我想創建一個用戶VS頁面視圖矩陣,矩陣中的每個條目的計數。

我正在使用Python堆棧,有沒有什麼辦法可以自動創建矩陣(numpy)?

我想大概情況下解析將是非常乏味,這是一個普遍的用例,所以必須有一些功能,但我找不到它。

感謝您的幫助。

回答

1

看來你需要pivotunstack

df1 = df.pivot(index='Page Name',columns='UserName',values='Count of Page Views by The User') 

df1 = df.set_index(['Page Name','UserName'])['Count of Page Views by The User'].unstack() 
print (df1) 
UserName David Michael Mike Minerva 
Page Name        
Buy   2.0  NaN 12.0  NaN 
Home  12.0 1112.0 NaN  56.0 
+0

非常感謝@jezrael!現在得到了DF。將以numpy啓動ml管道:) – Rafael

+2

@Rafael記住......! https://stackoverflow.com/help/someone-answers –

+0

@cᴏʟᴅsᴘᴇᴇᴅ謝謝! – Rafael