-1
類型變量origin
的是pyspark.rdd.PipelinedRDD
,並origin
包含類似:在pyspark查找字謎
[u'masquerade',
u'squaremade',
u'dianas',
u'naiads',
u'antagonist',
u'stagnation',
u'bates',
u'beast',
u'beats',
u'thanks']
我想通過鍵排序鍵和所有的字謎:
[(u'aadeemqrsu', {u'masquerade', u'squaremade'}),
(u'aadins', {u'dianas', u'naiads'}),
(u'aaginnostt', {u'antagonist', u'stagnation'}), ...
(u'abest', {u'bates', u'beast', u'beats'}), ...]
我知道可能需要map
或reducebykey
函數,但我真的不知道該怎麼做。