2016-04-26 64 views
0

我在格式字符串的RDD的文件:轉換的RDD [字符串]以JSON文件,無須轉換爲DataFrames [斯卡拉]

78656|twitterId:14|Hi|2010-05-19 

我想轉換此RDD [字符串]對在格式JSON文件:

tweetTable.toJSON.saveAsTextFile("Gaga") 

將其轉換爲一個JSON文件,但T:

"78656","twitterId:14","Hi","2010-05-19" 
我目前使用的代碼

他的數據格式如下:

"_1":"78656|twitterId:14|Hi|2010-05-19" 

有人可以幫助我嗎?

+1

' 「78656」, 「twitterId:14」, 「你好」, 「2010-05-19」 是'無效的JSON,可能你想要的東西像'{「id」:「78656」,「twitterId」:「14」,「test」:「你好」,「日期」:「2010-05-19」}'? –

+0

你在這裏使用什麼語言,'python','r'或'scala'? – SymbolixAU

+0

@VitaliyKotlyarenko:對,對不起,錯字。你提到它的方式正是我想要的方式。 – user2122466

回答

0

基於你有什麼的問題,你可以做這樣的事情:

value <- "78656|twitterId:14|Hi|2010-05-19" 
valueList <- strsplit(value, split ="\\|") 
library("jsonlite") 
res <- toJSON(valueList) 
+0

這是Scala嗎? – user2122466

+0

@ user2122466,不,它是'r',因爲你在你的問題中包含'r'標記。我已經刪除了額外的標籤。 – SymbolixAU