用Impala處理龐大的數據集

我對Impala和一些傳統的SQL數據庫系統有一個普遍的問題。我聽說Impala可以從字面上理解某些SQL語句，並將數十億行的表格（例如，帶有重複行的連接語句可能發生的情況）吐出。作爲一個更狹窄的例子，假設我運行「SELECT * FROM database」之類的東西。就直接控制檯輸出而言，我知道大多數傳統SQL數據庫在達到1000個條目的限制時將停止運行。 Impala也是如此嗎？換句話說，如果我在Impala中運行「SELECT * FROM database」，它理論上是在做更多的工作，即使它最終會吐出有限數量的行嗎？用Impala處理龐大的數據集

來源

2016-01-22 Alex R.

我認爲這取決於你用來做什麼查詢。如果您只是在Bash或Impala shell的命令行中運行，它將獲取所有結果，但是如果您使用Hue，它將按照您所描述的方式對結果進行翻頁。實際上，對於任何數據庫也是如此，如果您使用GUI來訪問它，您可以像導出到csv命令一樣運行以獲得完整的結果集，或者如果以編程方式訪問，則可以使用fetchall()。

來源

2016-01-22 04:10:09 maxymoo

用Impala處理龐大的數據集

回答

相關問題