我正在與numpy
一起工作,並試圖找到哪個平臺銷售的NA區域中的副本數量最多。使用numpy從CSV文件中提取數據
我有一個CSV文件來保存大量的數據看起來像這樣的:
Rank,Name,Platform,Year,Genre,Publisher,NA_Sales,EU_Sales,JP_Sales,Other_Sales,Global_Sales
1,Wii Sports,Wii,2006,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74
2,Super Mario Bros.,NES,1985,Platform,Nintendo,29.08,3.58,6.81,0.77,40.24
3,Mario Kart Wii,Wii,2008,Racing,Nintendo,15.85,12.88,3.79,3.31,35.82
4,Wii Sports Resort,Wii,2009,Sports,Nintendo,15.75,11.01,3.28,2.96,33
5,Pokemon Red/Pokemon Blue,GB,1996,Role-Playing,Nintendo,11.27,8.89,10.22,1,31.37
6,Tetris,GB,1989,Puzzle,Nintendo,23.2,2.26,4.22,0.58,30.26
7,New Super Mario Bros.,DS,2006,Platform,Nintendo,11.38,9.23,6.5,2.9,30.01
8,Wii Play,Wii,2006,Misc,Nintendo,14.03,9.2,2.93,2.85,29.02
9,New Super Mario Bros. Wii,Wii,2009,Platform,Nintendo,14.59,7.06,4.7,2.26,28.62
10,Duck Hunt,NES,1984,Shooter,Nintendo,26.93,0.63,0.28,0.47,28.31
11,Nintendogs,DS,2005,Simulation,Nintendo,9.07,11,1.93,2.75,24.76
我想用最銷售及NA區域售電量打印平臺。我怎樣才能做到這一點?
你到目前爲止嘗試了什麼? – fodma1
我硬編碼所有不同的平臺作爲掩碼,如: maskNES =(data [:,2] =='NES') 然後我將它分配給一個變量: pfNES = data [maskNES] [:, 6] .sum() 最後我比較了所有的平臺找到最高值的平臺。 只是看起來像一個愚蠢的做法。如果我有成千上萬個不同的平臺 哦,我把csv數據放到一個名爲'data'的矩陣中 – Rainoa