1
我正在使用Zeppelin 0.7.1和spark 2.1.0。無法在Zeppelin中運行其他段落之後VectorAssembler.transfrom
我已經得到了在數據幀「數據集」一些數據:
+-------+-------+-------+-------+
| index |var 1 |var 2 |var 3 |
+-------+-------+-------+-------+
| 0 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 1 | 0 | 1 | 0 |
+-------+-------+-------+-------+
| 2 | 1 | 0 | 1 |
+-------+-------+-------+-------+
,我想,爲了使線性迴歸,把每一列在一個向量列:
from pyspark.ml.linalg import Vectors
from pyspark.ml.feature import VectorAssembler
assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features')
output = assembler.transform(dataset)
那麼,在Zeppelin運行後,我無法運行其他段落。我必須重新啓動我的翻譯... 如果有人有問題可能來自哪裏的想法。
謝謝!