我是Apache Flink和分佈式處理的新手。我已經通過Flink快速安裝指南並瞭解MapFunctions的基礎知識。 但我無法找到一個XML處理的具體例子。 我已閱讀Hadoops XmlInputFormat,但無法理解如何使用它。使用Apache Flink進行XML處理
我需要的是, 我有如下格式的巨大(100MB)的XML文件,
<Class>
<student>.....</student>
<student>.....</student>
.
.
.
<student>.....</student>
</Class>
的弗林克處理器將讀取HDFS文件並開始處理它(基本上是通過所有的學生元素迭代)
我想知道(通俗地說),我該如何處理學生對象的xml和creata列表。
一個更簡單的外行的解釋,將不勝感激