的Python對於數據（CSV）

-1

循環我有這樣的數據：的Python對於數據（CSV）

http://prntscr.com/gojey0

這使向下繼續。

如何找到使用python代碼的前20個最常見的平臺？

我真的迷路了。我想可能是通過for循環列表並計算每個列表？看上去是錯的，但..

來源

2017-09-22 katie1245

使用熊貓：http://pandas.pydata.org/

類似：

import pandas as pd 
df = pd.read_csv("your_csv_file.csv") 
top_platforms = df.nlargest(20, "Score")["Platform"]

來源

2017-09-22 23:22:31

字典將是一個不錯的選擇，收集這樣的信息：

初始化一個空字典。

對於CSV文件的每一行：

獲取平臺列。
如果該平臺尚未在該詞典中，請以1爲單位創建該平臺。
否則，如果它已經在字典中，請將其計數加1。

完成後，按照計數值對字典進行排序並打印前20個條目。

來源

2017-09-22 23:25:09

我會用大熊貓CSV文件

import pandas as pd 
from collection import Counter 
df = pd.read_csv('DATA.csv') # read the csv file into a dataframe *df* 
# create counter object containing dictionary 
# invoke the pandas groupby and count methods 
d = Counter(dict(df.groupby(['Platform'])['Platform'].count()))

d閱讀會「包含」形式的字典一個計數器對象{<platform>:<number of counts in dataset>}

你可以得到頂k最常見的平臺如下：

k = 20 
d.most_common(k) 
>>> [('<platform1>', count1), 
    ('<platform2>', count2), 
    ('<platform3>', count3), 
    ('<platform4>', count4), 
    ....

希望有所幫助。在將來，最好看到數據的頭部（前幾行），或者到目前爲止您嘗試過的代碼......甚至是您使用的數據糾纏工具！

來源

2017-09-22 23:37:07 killerT2333

的Python對於數據（CSV）

回答

相關問題