假設我稱之爲DF和正則表達式的一個數據幀如下:斯卡拉 - 解釋爲正則表達式語句
var df2 = df
regex = new Regex("_(.)")
for (col <- df.columns) {
df2 = df2.withColumnRenamed(col, regex.replaceAllIn(col, { M => M.group(1).toUpperCase }))
}
我知道這個代碼是重命名DF2列這樣的,如果我有所謂的「user_ID的」列名,它會變成userId。
我瞭解withcolumnRenamed和replaceAllIn函數是做什麼的。我不明白的是這部分:{ M => M.group(1).toUpperCase }
什麼是M?什麼是組(1)?
我可以猜到發生了什麼,因爲我知道預期的輸出是userId,但我不認爲我完全理解這是如何發生的。
有人能幫我理解嗎?會真的很感激它。
謝謝!