我有一個PySpark數據幀與由添加列PySpark數據幀根據列值是否爲在另一列
[('u1', 1, [1 ,2, 3]), ('u1', 4, [1, 2, 3])].toDF('user', 'item', 'fav_items')
給定結構中我需要與根據是否「項目」 1或0添加另外的柱是否在'fav_items'中。
所以我想
[('u1', 1, [1 ,2, 3], 1), ('u1', 4, [1, 2, 3], 0)]
我怎麼會擡頭了第二欄到第三欄來決定價值,我怎麼會再加入呢?
非常聰明,但我不明白它先生零,你能給一個更深的解釋? –
@AlbertoBonsanto當然,我簡化了代碼並添加了一些評論。 – zero323