uwenku
標簽列表
apache-flink
7
熱度
1
回答
針對Apache Flink的BZip2壓縮輸入
我有一個使用bzip2壓縮的wikipedia轉儲(從http://dumps.wikimedia.org/enwiki/下載),但我不想解壓縮它:我想在進行解壓縮的同時處理它。 我知道可以用普通的Java來完成它(例如見Java - Read BZ2 file and uncompress/parse on the fly),但是我想知道它在Apache Flink中是如何做到的?我可能需要的是
bzip2
apache-flink
2015-04-03
4
熱度
1
回答
Apache Flink的XmlInputFormat
有沒有類似於Mahout's XmlInputFormat但是對於Flink? 我有一個很大的XML文件,我想提取特定的元素。在我的情況下,這是一個維基百科轉儲,我需要得到所有<page>標籤。 I.e.如果我有一個文件 <mediawiki> <siteinfo>...</siteinfo> <page>...</page> <page>...</page>
xml
mahout
apache-flink
2015-04-03
«
51
52
53
54
55
56
57
58
59
»
最新問題
1.
字體面在IE或邊緣
2.
訪問變量和模塊的方法,在多模塊程序
3.
如何在C#中使用Web HDFS REST API追加文件?
4.
Google Drive API v3 .NET:如何讓用戶直接從谷歌驅動器下載文件而不是從服務器下載文件?
5.
行表中的Javafx表
6.
最佳/最有效的方式爲nvarchar(最大)轉換到爲nvarchar(30)
7.
無法加入Mapbox SDK來的build.gradle
8.
Ramdajs keyBy相當於lodash
9.
PHP無法發送UTF-8的消息
10.
從表構建樹結構?