2013-09-24 95 views
0

我只是想知道有沒有人遇到過需要將數據從excel導入或讀取到Hadoop的場景?有沒有像Flume Excel源碼這樣的東西?Flume是否有Excel源代碼

btw,我知道我可以將excel文件轉換爲csv然後處理它。真的只是想在這裏探索一下水槽來源。

回答

1

Spooling Directory Source可以配置爲從Excel文件(或任何其他格式)讀取。正如文檔所述,這個源可以配置爲EventDeserializer - 實現將文件解析爲事件的邏輯的類。

我不認爲有人已經實現了這樣的反序列化器,但它似乎是非常容易的任務與Apache POI庫。

相關問題