我有一個RDD [(字符串,可迭代[WikipediaArticle])]這看起來是這樣的:遍歷CompactBuffer在RDD
(Groovy中,CompactBuffer(WikipediaArticle({有一個字符串冠軍} {有一些文本對應於該標題}),WikipediaArticle({具有字符串標題},{具有對應於該標題一些文本}))以上
大括號只是標題和區分文字,同時使東西更乾淨
的Groovy:是字符串名稱
WikipediaArticle:類有兩個屬性冠軍和文本
我需要類型的輸出:List[(String, Int)]
其中:
字符串:是第1個要素在RDD這在每行上都是唯一的
在上面的例子中是「Groovy」
Int:是緊湊緩衝區內維基百科文章的計數字符串
我試圖讓事情儘可能清楚,但是,如果您認爲有機會改善問題或者您有任何疑問,請隨時提問。
您正在尋求解決課程任務的方案,這是違反榮譽守則的。你試過什麼了? –
我知道我被卡住了,我也無法從討論部分找到任何幫助。我試圖用map來迭代compactbuffer,但沒有成功。我只需要一點提示我知道我在做一些愚蠢的事情。 –