我在同名的列上加入了兩個數據幀。在SparkR 1.5.0中,如何在公共列上加入後明確指定列?
oe = join(orders, emp, orders$EmployeeID == emp$EmployeeID)
所得數據幀有兩列具有相同名稱的EmployeeID
現在一組通過或者甚至在打印列名
peremp = groupBy(oe, 'EmployeeID', sales = n(oe$OrderID))
oe$EmployeeID
失敗,並在invokeJava錯誤
錯誤(isStatic = FALSE,objId $ id,methodName,...):
或g.apache.spark.sql.AnalysisException:引用'EmployeeID'是 含糊不清,可能是:EmployeeID#36,EmployeeID#69。
沒有必要的變通方法。您可以簡單地在父數據框中使用'$'函數訪問列。 – zero323