我使用MergeContent按以下方式「批量」處理來自多個ExecuteSQL的傳入響應。在合併內容處理器中,我將「最小條目數」設置爲1000,「最大條件期限」設置爲30秒。然後我有一個相關屬性名稱,用於分揀傳入的FlowFiles。這似乎按我的預期工作,但我的問題有兩個:批處理流文件進入MergeContent
答:這是一個明智的方法,還是有更好/更有效的方法來做到這一點?也許組合的ListFile/GetFile/MergeContent等...
B.是否存在性能/可伸縮性問題,具有「較大」數量的最小入口數量?
我的最終目標是嘗試將來自ExecuteSQL命令的許多結果合併到單個文件中,並由其相關屬性名稱進行歸檔。
除了Andy所說的之外,只是想提一下MergeContent在即將到來的Apache NiFi 1.1發行版中的性能改進,JIRA就是這個https://issues.apache.org/jira/browse/NIFI- 2850 –
嘿安迪和布萊恩,謝謝你的額外信息和見解。這1000個條目只是我選擇的任意數字,而目前大部分數據都包含在一些新的Flow文件中。這很大程度上取決於查詢從ExecuteSQL返回的速度,以及這些Flowfiles通過MergeContent處理器的其餘工作流程的速度。我會繼續修改各種配置設置並進行相應的調整。再一次,謝謝你。 – danoyoung