根據NiFi's homepage,它「支持數據路由,轉換和系統中介邏輯的強大且可擴展的有向圖」。使用NiFi調度Hadoop批處理
我在過去幾個月一直在玩NiFi,不禁想知道爲什麼不用它來調度批處理過程。
比方說,我有一個用例,其中數據流入Hadoop,由一系列Hive \ MapReduce作業處理,然後導出到某個外部NoSql數據庫供某些系統使用。
使用NiFi爲了將數據攝入和流入Hadoop是NiFi的一個用例。
但是,使用Nifi來安排Hadoop上的作業(「Oozie-like」)是一種用例,我沒有遇到過其他人的實現,並且由於它似乎完全可以實現,所以我試圖瞭解它是否存在是不這樣做的理由。
在NiFi上完成所有工作的好處是可以在一個地方從源代碼到目的地直觀地呈現整個數據過程。在流量複雜的情況下,對維護非常重要。
換句話說 - 我的問題是:是否有理由不使用NiFi作爲批處理的調度程序\協調程序?如果是這樣 - 在這種用例中可能會出現什麼問題?
PS - 我讀過這樣的:「Is Nifi having batch processing?」 - 但我的問題的目的是「在NiFi批量處理」不同的感覺比一個在附加問題提出
感謝您的回答。我會盡力澄清我的問題:我知道NiFi的優勢(以及爲獲得數據而通過NiFi流動的數據),並打算在相關時使用它們。但是,在許多使用情況下,我想運行批處理流程,並想知道我會錯過什麼,如果我這樣做,我會在哪裏失敗。 – giladovich