1
二元響應我現在有一個RDD在那裏我有兩列這是創建轉換時間變量
Row(pickup_time=datetime.datetime(2014, 2, 9, 14, 51)
dropoff_time=datetime.datetime(2014, 2, 9, 14, 58)
我希望將這些轉化爲二元響應變量,其中1將表明夜間和功能0表示白天。
我知道我們可以使用UserDefinedFunction
來創建一個函數,以便將它們更改爲所需的格式。
比如我有另一列是指定的支付類型是「CSH」或「CRD」,所以我能解決,這樣做
pay_map = {'CRD':1.0, 'CSH':0.0}
pay_bin = UserDefinedFunction(lambda z: pay_map[z], DoubleType())
df = df.withColumn('payment_type', pay_bin(df['payment_type']))
我將如何應用此相同的邏輯字符串到我問的問題?如果這有助於我嘗試轉換這些變量,因爲我將運行一個決策樹。