所以我正在使用Spark RDD。我有以下格式如何爲這種格式創建鍵值對?
Actor1 Movie1
Movie2
Movie3
Actor2 Movie4
Movie5
Movie6
製表符分隔文件,我想創建鍵值對,其中關鍵是演員,和值在演員澆鑄的電影。我如何使用Scala或Python來做到這一點?我能夠讀取文本文件並從選項卡中拆分行,如下所示,但我不知道如何形成鍵值對。
lines = sc.textFile("file")
tuples = lines.map(lambda x: x.split("\t"));
# how do I create key value pairs???
輸入文件按原樣輸出,我無法更改。 – MetallicPriest 2014-11-04 11:56:11