我寫使用如何從PySpark中的地圖方法返回空(null?)項目?
RDD.map(lambda line: my_method(line))
並且基於my_method特定條件(假設符合「A」開頭)的映射方法,我想要麼返回一個特定的值,否則都在一起忽略該項。
現在,我返回-1,如果條件未在項目遇到了,然後再使用另一
RDD.filter() method to remove all the ones with -1.
什麼更好的辦法能夠通過從my_method返回null忽略這些項目嗎?