回答

5

從Python文檔我們有:

categoricalFeaturesInfo: Map storing arity of categorical 
      features. E.g., an entry (n -> k) indicates that 
      feature n is categorical with k categories indexed 
      from 0: {0, 1, ..., k-1}. 

嘗試使用:

categoricalFeaturesInfo = {12:4} 
+0

categoricalFeaturesInfo = {12:4}:不工作 –

+0

我的不好,我忘了python索引從0開始在這裏...所以categoricalFeaturesInfo = {11:4}作品 –

+0

如何使用'月份'變量,從1到12?如果'months'是第一列:'categoricalFeaturesInfo = {0:12}'將不起作用,因爲它會查找0到11之間的類別! – rom

0

對於火花2.0及以上

它的一個字典 與密鑰作爲變量的索引/位置rdd(功能) 和值作爲類別的數量