-1
計算的數據使用pyspark 2.0.1星火:添加兩列,並與來自其他列
我有這樣的數據幀填充它們
+-----------+----------+
| Longitude | Latitude |
+-----------+----------+
| 1 | 3 |
| 2 | 1 |
| 2 | 3 |
+-----------+----------+
我想補充效率兩列稱爲市,省對於每一行,使用列的值(經度和緯度)作爲我已經寫入的python函數的輸入返回城市和省。 所以輸出應該是這樣的
+-----------+----------+--------+--------
| Longitude | Latitude | City | Province
+-----------+----------+--------+--------
| 1 | 3 | London| London
| 2 | 1 | Paris | Paris
| 2 | 3 | Dubai | Dubai
+-----------+----------+--------+--------