Q

弗林克流AWS S3並行讀取

2017-07-18 111 views 1 likes

1

我是新來弗林克多個文件，我的理解是繼API調用弗林克流AWS S3並行讀取

StreamExecutionEnvironment.getExecutionEnvironment().readFile(format, path)

將並行讀取該文件給出S3存儲路徑。

我們存儲S3的日誌文件。要求是服務多個客戶端請求從具有時間戳的不同文件夾讀取。

對於我的使用情況，服務多個客戶端的請求，我正在評估使用弗林克。因此，我希望Flink能夠針對不同的AWS S3文件路徑並行執行AWS S3讀取。

是否有可能在單弗林克工作實現這一目標。有什麼建議麼？關於S3文件系統的支持

2017-07-18 Abirami

A

回答

0

文檔可以發現here。

您可以從不同的目錄讀取和使用union()運營商的所有記錄在不同的目錄合併成一個流。

也可以通過使用類似（未經測試）來讀取嵌套文件：

TextInputFormat format = new TextInputFormat(path); 
Configuration config = new Configuration(); 
config.setBoolean("recursive.file.enumeration", true); 
format.configure(this.config); 
env.readFile(format, path);

2017-07-18 15:28:17 twalthr

相關問題

11. 壞逆足與弗林克
12. OutOfBoundsException與ALS - 弗林克MLlib
13. 誤差弗林克0.10.1
14. 弗林克：當我加計
15. 卡夫卡和弗林克：獲取流的webapp
16. JunitTest的數據流中與弗林克斯佩克特
17. 阿帕奇弗林克：上KeyedStream
18. 的時間戳弗林克窗口
19. 弗林克流作業切換到故障狀態
20. 弗林克JDBCInputFormat找不到方法「setRowTypeInfo」
21. 使用C/C++在Apache的弗林克
22. 弗林克流而計算總和拋出異常
23. 弗林克一批ReadCSV - zip文件
24. 弗林克卡夫卡連接
25. 沒有正在從弗林克圖案化流
26. 阿帕奇弗林克進口Scala的API擴展流
27. 水印中的Apache弗林克
28. 消耗阿帕奇弗林克
29. 弗林克timeWindow得到啓動時間
30. 即使在阿帕奇弗林克