我想兩個dataframes與偏好結合起來,在正確的離開留下數據幀的數據:如何組合數據框而不丟失數據?
我目前有:
(Pdb) pp question_struct
QuestionID RowID MenuID ColumnID SourceRowID SourceColumnID SourceVariationID
0 316926394 3029937752 0 0 3029937752 0 0
1 316926394 3029937753 0 0 3029937753 0 0
2 316926394 3029937754 0 0 3029937754 0 0
3 316926394 3029937755 0 0 3029937755 0 0
4 316926394 3029937756 0 0 3029937756 0 0
5 316926394 3029937757 0 0 3029937757 0 0
[6 rows x 7 columns]
(Pdb) pp df
QuestionID RowID ColumnID MenuID SourceRowID SourceColumnID SourceVariationID ResponseCount
0 316926394 3029937753 0 0 3029937753 0 0 1
[1 rows x 8 columns]
(Pdb) df.combine_first(question_struct)
ColumnID MenuID QuestionID ResponseCount RowID SourceColumnID SourceRowID SourceVariationID
0 0 0 316926394 1 3029937753 0 3029937753 0
1 0 0 316926394 NaN 3029937753 0 3029937753 0
2 0 0 316926394 NaN 3029937754 0 3029937754 0
3 0 0 316926394 NaN 3029937755 0 3029937755 0
4 0 0 316926394 NaN 3029937756 0 3029937756 0
5 0 0 316926394 NaN 3029937757 0 3029937757 0
[6 rows x 8 columns]
,但它正在失去question_struct 3029937752的第一行,即使它不與df中的任何內容發生衝突,並且與衝突3029937753重複。
如果RowID是這些幀的索引,這將工作。 –