df = pd.read_csv(file, sep=',', encoding='ISO-8859-1')
column_names = list(df.columns)
col_mapping = {'Sex ':'Sex', 'Fatal (Y/N)': 'Fatal', 'Species ' : 'Species'}
df = df.rename(columns=col_mapping, copy=False)
我已經轉換了數據,從DF [「年齡」]列包含該值的字母或其它符號採取的NaN清潔和分組值
df['Age'] = np.where(pd.to_numeric(df['Age'], 'coerce').notnull(), df['Age'], NaN)
我試圖值使用df.dropna(df.Age)
清除NaN
值,但它給我:TypeError:'系列'對象是可變的,因此它們不能被哈希
我想知道如何設置此問題以及如何對結果值進行分組和計數bu範圍(即18 - 25年:215,25 - 50:300)婷
爲了幫助進行分組,你需要表現出一定的樣本數據,並給更好地描述你想看到的內容。看到這篇文章的指導http://stackoverflow.com/help/mcve – piRSquared