2017-08-16 28 views
0

我想在PySpark中只看到n個數字(例如3)的浮點數。有沒有辦法設置默認值?請注意,我不想整理實際的數據。如何設置PySpark中顯示的默認位數?

的如下說明我已經和它是太多信息:

>>> df = sc.parallelize([ ('a', 1), ('b', 2) ]).toDF() 
>>> df.withColumn("x", rand()).show() 
+---+---+------------------+ 
| _1| _2|     x| 
+---+---+------------------+ 
| a| 1|0.7468471761178085| 
| b| 2|0.6189219219244186| 
+---+---+------------------+ 

謝謝!

回答

1

如果它僅用於顯示,你可以用大熊貓,並指定一個浮點格式:

pd.options.display.float_format = '{:,.2f}'.format 
df = sc.parallelize([ ('a', 1), ('b', 2) ]).toDF() 
df.withColumn("x", rand()).limit(20).toPandas() 
相關問題