0
目的是變換駐留在一個文件中的整數:這個RDD來自哪裏空白?
1 2 3
4 5 6
7 8 9
成三個陣列,以便能夠執行數學運算。
預計
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
實際
[[u'1', u' ', u'2', u' ', u'3'], [u'4', u' ', u'5', u' ', u'6'], [u'7', u' ', u'8', u' ', u'9']]
代碼
txt = sc.textFile("integers.txt")
print txt.collect()
#[u'1 2 3', u'4 5 6', u'7 8 9']
pairs = txt.map(lambda x: x.split(' '))
print pairs.collect()
#[[u'1', u'2', u'3'], [u'4', u'5', u'6'], [u'7', u'8', u'9']]
pairs = txt.map(lambda x: [s for s in x])
print pairs.collect()
#[[u'1', u' ', u'2', u' ', u'3'], [u'4', u' ', u'5', u' ', u'6'], [u'7', u' ', u'8', u' ', u'9']]