-1
火花界異常的我是一個初學者到Scala和我在做什麼是數據集映射到(k, v)
對其中kv(0)
和kv(1)
是字符串,kv(2)
是一個列表。代碼列表如下:了使用Scala的
val rdd_q1_bs = rdd_business.map(lines => lines.split('^')).map(kv =>
(kv(0), (kv(1), kv(2))))
但這裏的問題,有數據集中kv(2)
一些空列表。因此,當我使用.collect()
收集所有元素時,可能會出現越界異常。 我在想的是定義一個函數並檢查kv
的長度。有什麼簡單的方法,我可以忽略異常並保留該過程,或用字符串替換kv(2)
?
這真的有幫助,謝謝〜 –