我是熊貓的全新品牌,請原諒這個問題的基本原理。我有一個CSV文件,我讀如何排序和選擇熊貓數據
df = pandas.read_csv("file.csv")
我想現在執行一些基本功能的數據。例如
- 排序列11柱分8
- 只選擇那些記錄包含在現場6
你怎麼能做到這一點的特定字符串?
一些示例數據:
931,Oxfordshire,9314125,123255,Larkmead School,Abingdon,125,124,20,SUPP,8
931,Oxfordshire,9314126,123256,John Mason School,Abingdon,164,164,25,6,16
931,Oxfordshire,9314127,123257,Fitzharrys School,Abingdon,150,149,9,0,11
通過刪除CSV文件中註釋的前幾行,然後
df = pandas.read_csv("GCSEIGCSEresultsv2.csv", header=None, names=['A','B','C','D','E','F','G', 'H','I','J'])
我得到
df.dtypes
Out[20]:
A object
B int64
C int64
D object
E object
F object
G object
H object
I object
J object
dtype: object
我需要告訴大熊貓SUPP意味着我認爲的NaN。
你到目前爲止嘗試過什麼?您還需要顯示您的csv文件的外觀,並顯示您的預期輸出。 – TomAugspurger
我鼓勵你閱讀[documentation](http://pandas.pydata.org/pandas-docs/stable/10min.html),並回來至少試圖解決這個問題。 – arkottke
@Anush我認爲你需要先嚐試一些事情,然後回來一個具體的問題,而不是要求解決方案,這是非常基本的 – EdChum