1
我正在從文本文件構建RDD。有些行不符合我期待的格式,在這種情況下,我使用標記-1。從Spark RDD中刪除元素
def myParser(line):
try:
# do something
except:
return (-1, -1), -1
lines = sc.textFile('path_to_file')
pairs = lines.map(myParser)
是否可以使用-1
標記刪除行?如果不是,那麼它有什麼解決方法?
只是使用'filter' ...不是? – Markon
在Java中我使用了一個過濾器:.filter(new Function(){public Boolean call(CassandraRow row)throws Exception {return row.getString(「value」)。equals(whatIWant); } } )。 –
Fundhor
什麼是lambda函數的參數。關鍵,價值還是兩者? – Bob