從另一列中出現的一列列中的字符串中刪除單詞的過程是什麼?刪除出現在其他列中的單詞,Pandas
如:
Sr A B C
1 jack jack and jill and jill
2 run you should run, you should ,
3 fly you shouldnt fly,there you shouldnt ,there
可以看出,我想column C
,使得其一個的B減內容。請注意第三個示例,其中fly
後跟一個逗號,所以它還應考慮標點符號(如果代碼更傾向於檢測其周圍的空間)。
Column A
也可以有2個單詞,所以這些都需要刪除。
我需要在熊貓的表情,一樣的東西:
df.apply(lambda x: x["C"].replace(r"\b"+x["A"]+r"\b", "").strip(), axis=1)
列A會包含一個單詞嗎?如果它有更多的單詞,我們是否必須在第2列中找到確切的字符串作爲匹配?或者它可能是隨機排列的字符串? –
完全匹配的情況下,有2個單詞..「在那裏飛」在A應該匹配「在那裏飛」B並將其刪除。 –