至少兩個詞我使用Pandas
快,矢量str.contains
的方法來檢查我的數據幀每一行是否包含從我list_word
至少一個字。熊貓:檢查是否字符串包含從列表
list_words='foo ber haa'
df = pd.DataFrame({'A' : ['foo foor', 'bar bar', 'foo hoo', 'bar haa',
'foo bar', 'bar bur', 'foo fer', 'foo for']})
df
Out[113]:
A
0 foo foor
1 bar bar
2 foo hoo
3 bar haa
4 foo bar
5 bar bur
6 foo fer
7 foo for
df.A.str.contains("|".join(list_words.split(" ")))
Out[114]:
0 True
1 False
2 True
3 True
4 True
5 False
6 True
7 True
Name: A, dtype: bool
問題是:我怎麼能檢查每個行是否包含從列表中至少兩個詞?。
我想堅持str.contains
,因爲它比其他Python字符串匹配算法快得多。
讓我們[繼續聊天討論](http://chat.stackoverflow.com/rooms/118456/discussion-between-jon-克萊門茨和-jezrael)。 –