2017-10-16 75 views
0

計數爲每個類別列內容,有一組類別精確字符串匹配str.count(),熊貓蟒

  1. 男 - 貓,
  2. 女 - 貓,
  3. 男 - 貓-female

隨着df.temp.str.count(i),它顯示男 - 貓算作'2',其當在數據搜索,這只是'1',錯誤地包括第三類的子串。

任何幫助將不勝感激。

+1

我想你應該發佈一些數據,有你想要什麼更好的描述。 –

回答

2

你需要使用正則表達式從here

df['count'] = df.temp.str.count(r'(?<!\S)Male-Cat(?!\S)') 
print (df) 

              temp count 
0 Male-Cat Female-Cat Male-Cat-Female Male-Cat  2 
1        Male-Cat-Female  0 
2          Male-Cat  1 
3    Male-Cat Male-Cat Male-Cat-Female  2 
4     Male-Cat Male-Cat Male-Cat  3