我有兩個數據幀df1和df2。 相同的索引和相同的列名稱。 如何構建一個顯示差異的數據框,但只有至少有一個不同單元格的行? 如果行有不同的單元格,但有些相同,請保持相同的單元格不變。顯示數據幀df1,df2之間的完整行高差,但僅當行單元存在差異時
例如:
df1=pd.DataFrame({1:['a','a'],2:['c','c']})
df2=pd.DataFrame({1:['a','a'],2:['d','c']})
輸出需要:
在這個例子中pd.DataFrame({1:['a'],2:['c->d']},index=[0])
輸出應該是一個行數據幀,而不是數據幀包括相同的行
NB:輸出應該僅含有full行在單元格中至少有一個差異
我想一個有效的解決方案,而按行迭代,並沒有在數據幀
創建特殊字符串
我喜歡它。更多pandastic – dataflow
是的,我喜歡report_diff解決方案,但我想我的輸出數據框沒有相同的行。我編輯了這個問題來突出顯示它。 dataframe可以是100MB,可以包含任何字符串或數字 – alexprice
@alexprice,請參閱UPDATE – MaxU