我有一個數據幀的數據與下面列使用WithColumn與外部功能
1)FILEFORMAT是以下所有列數據類型CSV 2)字符串
employeeid,pexpense,cexpense
現在我需要建立一個新的數據幀其中有一個名爲expense
的新列,它是根據列pexpense
,cexpense
進行計算的。
棘手的部分是計算算法是不是我創建了一個UDF功能,但它是一個外部函數,需要從一個Java庫,需要原始類型作爲參數輸入 - 在這種情況下pexpense
,cexpense
- 計算新列所需的值。
函數簽名是從外部Java罐子
public class MyJava
{
public Double calculateExpense(Double pexpense, Double cexpense) {
// calculation
}
}
所以,我怎麼可以調用外部函數來創建一個新的計算列。我可以在Spark應用程序中將該外部函數註冊爲UDF嗎?
您可以編輯您的文章,並添加您的數據框(1)的模式(讓大家看到列的*數據類型*)和(2)您正在討論的方法的_signature_? –
@TzachZohar我已更新帖子 – shiv455
@TzachZohar我已更新帖子 – shiv455