narcoticsCrimeTuples = narcoticsCrimes.map(lambda x:(x.split(",")[0], x))
我有一個CSV我想通過分割逗號進行解析,每個字符串數組中的第一項是主鍵。
主叫narcoticsCrimeTuples.first()[1]
這個anonymmous split函數做什麼?
我的當前理解當我想獲得在單獨的行密鑰(或只是分離)從所述的值是「分裂X由逗號,取每個分裂[0]的第一部分,和作爲新的x'返回,但我很確定中間部分是不正確的,因爲[]內的數字可以是任何東西並返回相同的結果。
該表達'narcoticsCrimes.map(拉姆達X:(x.split( 「」)[0]中,x))'是無效的。你可以做這樣的'map(函數,逗號,分隔「.split(」,「)) - 但你的問題沒有說明。 –
'narcoticsCrimes'是一個自定義對象嗎?它是否有自己定義的'map'方法? –
@JordanBonitatis PySpark。這是一個RDD –