2016-08-15 56 views

回答

8

數據來源是所有關於理解數據的來源和歸屬。在典型的系統中,你會得到'日誌'。當你考慮數據流經一系列進程和隊列時,最終會有很多課程。如果你想要遵循某條數據所採用的路徑,或者需要多長時間才能走上這條路,或者發生了什麼事情,將對象分解成不同的對象等等,所有這些都是非常耗時和困難的。 NiFi支持的出處就像登錄類固醇,並且全都是關於保持和追蹤數據與事件之間的這些關係,這些關係塑造並影響了發生的事情。 NiFi正在跟蹤每條數據的來源,它對數據的瞭解,在分裂,連接,轉換,發送數據的位置以及最終丟棄數據時保持不變。把它想象成一個數據監管鏈。

這真的很有價值,原因有幾個。首先,瞭解和調試。擁有這個源頭可以捕獲來自給定的手段,甚至可以在流程中向前或向後查看數據來源和去向。鑑於NiFi在封面下還有一個不可變版本的內容存儲,您還可以使用它直接點擊流程每個階段的內容。您也可以根據最新流程重播給定事件的內容和上下文。這反過來意味着更快地迭代到您想要的配置和結果。出於合規性原因,此出處模型也很有價值。您可以證明您是否將數據發送到了正確的系統。如果你知道你沒有那麼可以解決問題的數據或創建一個強大的審計跟蹤跟蹤。

Apache NiFi的出處模型非常強大,它也被擴展到Apache MiFi的子項目Apache MiNiFi。產生更多出處的更多系統將意味着你有更強大的跟蹤端到端數據的能力。當它可以與其他血統系統或集中式血統商店結合時,它變得更加強大。 Apache Atlas可能是一個很好的系統,可以集成這個系統來集中視圖。 NiFi不僅能夠做到我上面描述的內容,還能將這些活動發送到這樣的中央商店。所以,今後會有令人興奮的時刻。

希望有所幫助。

+0

這是非常有用的/ –

相關問題