創建新的數據幀我有一個字典,如:如何使用字典
cMap = {"k1" : "v1", "k2" : "v1", "k3" : "v2", "k4" : "v2"}
和一個數據幀A,像:
+---+
|key|
+----
| k1|
| k2|
| k3|
| k4|
+---+
創建上面的代碼DataFame:
data = [('k1'),
('k2'),
('k3'),
('k4')]
A = spark.createDataFrame(data, ['key'])
我想獲得新的DataFrame,例如:
+---+----------+----------+
|key| v1 | v2 |
+---+----------+----------+
| k1|ture |false |
| k2|ture |false |
| k3|false |ture |
| k4|false |ture |
+---+----------+----------+
我希望得到一些建議,謝謝!
實際上,還有更多的價值,你能告訴我如何構建UDF嗎? –