2
之前我所有的人都是蟒蛇和火花世界的新人。 我從大學作業,但我卡在一個地方。 我做集羣化從我的數據,現在我有我的PipelinedRDDpyspark piplineRDD適合Dataframe列
集羣aftre這樣的:現在我有cluster
和我的數據幀 cluster = featurizedScaledRDD.map(lambda r: kmeansModelMllib.predict(r)) cluster = [2,1,2,0,0,0,1,2]
現在dataDf
我需要適合我的cluster
像一個新列dataDf
i Have: i Need:
+---+---+---+ +---+---+---+-------+
| x | y | z | | x | y | z |cluster|
+---+---+---+ +---+---+---+-------+
| 0 | 1 | 1 | | 0 | 1 | 1 | 2 |
| 0 | 0 | 1 | | 0 | 0 | 1 | 1 |
| 0 | 8 | 0 | | 0 | 8 | 0 | 2 |
| 0 | 8 | 0 | | 0 | 8 | 0 | 0 |
| 0 | 1 | 0 | | 0 | 1 | 0 | 0 |
+---+---+---+ +---+---+---+-------+
謝謝是的我不使用:/現在我看到了我的錯誤 –
我想我可能會在你第一次看到它之後進行編輯。 – user7337271