我有一個數據框,其中列'a'是兒童列表和列'b',它是每個孩子的玩具數量根據另一列中的字符串段選擇大熊貓數據幀的列中的數據
dic = { 'a': [ 'pippo', 'giovanni', 'giacomo', 'giovanni', 'giovanni', 'pippo'],\
'b': [ 3, 5, 1, 10, 7, 8]}
df = pd.DataFrame(dic)
數據幀是
a b
0 pippo 3
1 giovanni 5
2 giacomo 1
3 giovanni 10
4 giovanni 7
5 pippo 8
在這種情況下,一些孩子正在repeted在數據幀,如果我想知道有多少玩具有喬萬尼,比我只是寫這
df['b'][ df['a'] == 'giovanni' ]
1 5
3 10
4 7
第二列數字的總和是喬瓦尼所擁有的玩具數量(5 + 10 + 7 = 22)。
但是,如果他的名字的最後兩個字母沒有正確書寫,我怎麼才能算出喬瓦尼所擁有的玩具的數量?這裏的情況
dic = { 'a': [ 'pippo', 'giovanLi', 'giacomo', 'giovanNi', 'giovanMi', 'pippo'],\
'b': [ 3, 5, 1, 10, 7, 8]}
df = pd.DataFrame(dic)
數據幀是
a b
0 pippo 3
1 giovanLi 5
2 giacomo 1
3 giovanNi 10
4 giovanMi 7
5 pippo 8
,我想這樣的事情
df['b'][ df['a'][:-2] == 'giovan' ]
,從一個事實,即在B列有一個選擇玩具的所有號碼以'giovan'開頭的字符串。
你對我有什麼建議?