2017-06-19 35 views
1

我正在使用Zeppelin 0.7.1和spark 2.1.0。無法在Zeppelin中運行其他段落之後VectorAssembler.transfrom

我已經得到了在數據幀「數據集」一些數據:

+-------+-------+-------+-------+ 
| index |var 1 |var 2 |var 3 | 
+-------+-------+-------+-------+ 
| 0  | 0  | 1  | 0  | 
+-------+-------+-------+-------+ 
| 1  | 0  | 1  | 0  | 
+-------+-------+-------+-------+ 
| 2  | 1  | 0  | 1  | 
+-------+-------+-------+-------+ 

,我想,爲了使線性迴歸,把每一列在一個向量列:

from pyspark.ml.linalg import Vectors 
from pyspark.ml.feature import VectorAssembler 


assembler = VectorAssembler(inputCols=['var 1', 'var 2', 'var 3'], outputCol='features') 
output = assembler.transform(dataset) 

那麼,在Zeppelin運行後,我無法運行其他段落。我必須重新啓動我的翻譯... 如果有人有問題可能來自哪裏的想法。

謝謝!

回答

1

Zeppelin 0.7.2版應該可以解決您的問題。 我們遇到了同樣的問題,我們只是用相同的版本和升級來測試它,這很好。

關於

相關問題