我想過濾一個具有類別列的數據幀(List [String])。我想忽略所有具有無效類別的行。他們是無效的,當他們不在model.getCategories通過Array列過濾DataFrame
def checkIncomingData(model: Model, incomingData: DataFrame) : DataFrame = {
val list = model.getCategories.toList
sc.broadcast(list)
incomingData.filter(incomingData("categories").isin(list))
}
不幸的是我的方法是行不通的,因爲類別是一個列表,而不是一個單一的元素。任何想法讓它工作的人?
廣播在這裏沒有效果。 –
打擾一下嗎?我試圖在問題的背景下保留我的答案 –
想想評估的順序。對isin'的爭論在駕駛員中進行了熱烈的評估。它和'lncomingData.filter($「categories」.isin(list))沒有什麼不同' –