string_integers.txtRDD中的主要空白來自哪裏以及如何避免它?
a 1 2 3
b 4 5 6
c 7 8 9
sample.py
import re
pattern = re.compile("(^[a-z]+)\s")
txt = sc.textFile("string_integers.txt")
string_integers_separated = txt.map(lambda x: pattern.split(x))
print string_integers_separated.collect()
結果
[[u'', u'a', u'1 2 3'], [u'', u'b', u'4 5 6'], [u'', u'c', u'7 8 9']]
預期結果
[[u'a', u'1 2 3'], [u'b', u'4 5 6'], [u'c', u'7 8 9']]
'類型錯誤:拆分()不帶任何關鍵字參數' – 030