2013-06-06 289 views
1

你能告訴我怎麼組表(從products1.txt文件),如下列:分組蟒蛇大熊貓

Age;Name;Country 
10;Valentyn;Ukraine 
12;Igor;Russia 
12;Valentyn; 
10;Valentyn;Russia 

所以我可以找出許多Valentyns如何有一個空的「國家」的細胞。
我跑到下面的代碼:

import pandas as pd 
df = pd.read_csv('d:\products1.txt', sep = ";") 
result = df[(df["Name"] == "Valentyn") & (df["Country"] == None)] 

但我得到一個錯誤......

回答

2

您應該使用isnull(而不是== None)來檢查NaN

In [11]: df[(df.Country.isnull()) & (df.Name == 'Valentyn')] 
Out[11]: 
    Age  Name Country 
2 12 Valentyn  NaN 

另一種選擇將檢查那些國家NaN,然後計數值:

In [12]: df.Name[df.Country.isnull()] 
Out[12]: 
2 Valentyn 
Name: Name, dtype: object 

In [13]: df.Name[df.Country.isnull()].value_counts() 
Out[13]: 
Valentyn 1 
dtype: int64