0
我對Impala和一些傳統的SQL數據庫系統有一個普遍的問題。我聽說Impala可以從字面上理解某些SQL語句,並將數十億行的表格(例如,帶有重複行的連接語句可能發生的情況)吐出。作爲一個更狹窄的例子,假設我運行「SELECT * FROM database」之類的東西。就直接控制檯輸出而言,我知道大多數傳統SQL數據庫在達到1000個條目的限制時將停止運行。 Impala也是如此嗎?換句話說,如果我在Impala中運行「SELECT * FROM database」,它理論上是在做更多的工作,即使它最終會吐出有限數量的行嗎?用Impala處理龐大的數據集