2017-09-22 31 views

回答

0

使用熊貓:http://pandas.pydata.org/

類似:

import pandas as pd 
df = pd.read_csv("your_csv_file.csv") 
top_platforms = df.nlargest(20, "Score")["Platform"] 
0

字典將是一個不錯的選擇,收集這樣的信息:

初始化一個空字典。

對於CSV文件的每一行:

  1. 獲取平臺列。
  2. 如果該平臺尚未在該詞典中,請以1爲單位創建該平臺。
  3. 否則,如果它已經在字典中,請將其計數加1。

完成後,按照計數值對字典進行排序並打印前20個條目。

0

我會用大熊貓CSV文件

import pandas as pd 
from collection import Counter 
df = pd.read_csv('DATA.csv') # read the csv file into a dataframe *df* 
# create counter object containing dictionary 
# invoke the pandas groupby and count methods 
d = Counter(dict(df.groupby(['Platform'])['Platform'].count())) 

d閱讀會「包含」形式的字典一個計數器對象{<platform>:<number of counts in dataset>}

你可以得到頂k最常見的平臺如下:

k = 20 
d.most_common(k) 
>>> [('<platform1>', count1), 
    ('<platform2>', count2), 
    ('<platform3>', count3), 
    ('<platform4>', count4), 
    .... 

希望有所幫助。在將來,最好看到數據的頭部(前幾行),或者到目前爲止您嘗試過的代碼......甚至是您使用的數據糾纏工具!