2016-08-11 66 views
3

我想使用spark sql遞歸查詢分層數據集並確定所有嵌套子項的父根。如何使用Spark Sql做遞歸查詢

我試過使用自聯接,但它只適用於1級。

任何想法或指針?

感謝

+1

比建設上的反覆連接頂部您查詢其他你不。你可以看看[graphframes](https://github.com/graphframes/graphframes),但這些都相當有限。 – zero323

+0

@ zero323 - 連接的問題是無法知道連接的深度。它可能是1級,2級或3級深層/交易 –

+0

我完全意識到這一點,但這是你必須以某種方式處理的事情。如果您需要對執行過程進行細粒度的控制,您可以放到GraphX API中,但是如果您想要高級方法,那麼這是唯一的選擇。 – zero323

回答