我的目標是讓大熊貓相當於下面的R代碼裏面的:熊貓/ Python的等效復ifelse比賽中的R
df1$String_1_check = ifelse(df1$String_1 == df2[match(df1$String_2, df2$String_2), 1], TRUE, FALSE)
如果DF1的列STRING_1的第n行的值等於第一列df2的第n列第2行與df2的第2個字符串匹配,則在新列中爲True,否則爲String_1_check中的False。
df1在String_1和String_2中有許多相同值的實例,並且df2僅在String_1中具有每個可能值的一個實例。 String_3不是唯一的。與這些樣品dataframes:
df1 = pd.DataFrame({'String_1': ['string 1', 'string 1', 'string 2', 'string 3', 'string 1'], 'String_2': ['string a', 'string a', 'string b', 'string a', 'string c']})
df2 = pd.DataFrame({'String_3': ['string 1', 'string 2', 'string 3'], 'String_2': ['string a', 'string b', 'string c']})
String_1 String_2
0 string 1 string a
1 string 1 string a
2 string 2 string b
3 string 3 string a
4 string 1 string c
String_3 String_2
0 string 1 string a
1 string 2 string b
2 string 3 string c
所需的輸出將是:
String_1 String_2 String_1_check
0 string 1 string a True
1 string 1 string a True
2 string 2 string b True
3 string 3 string a False
4 string 1 string c False
我試圖np.where
,isin
,pd.match
(廢棄),但還沒有找到一個解決方案。
這最終爲我的真實數據情況提供了最好的工作。謝謝! –