2014-03-12 22 views
1

使用str.contains時是否存在等價物?str.contains中的 b單詞邊界的等價物?

以下代碼因「Sa」而錯誤地將「Said Business School」列爲類別。如果我可以創建一個單詞邊界,它將解決問題。在這之後放置一個空間。我正在使用熊貓,這是dfs。我知道我可以使用正則表達式,但只是好奇,如果我可以使用字符串,使其更快

gprivate_n = ('Co|Inc|Llc|Group|Ltd|Corp|Plc|Sa |Insurance|Ag|As|Media|&|Corporation') 
df.loc[df[df.Name.str.contains('{0}'.format(gprivate_n))].index, "Private"] = 1 
+0

對不起,我正在使用熊貓! – user3314418

+2

只需使用正則表達式的單詞邊界... – poke

回答

1

字邊界是不是性格,所以你不能用.contains找到它。您需要使用正則表達式或將字符串拆分爲單詞,然後檢查當前在gprivate_n中定義的集合中每個單詞的成員資格。

+0

是的,我剛剛結束了使用正則表達式...... – user3314418