2015-05-22 33 views
0

我正在嘗試使用tTikaExtractor組件來提取文件夾中多個文件的內容。Talend迭代tTikaExtractor

它正在處理單個文件,但是當我添加一個tFileList組件時,我不明白如何獲取2個不同文件的內容。

我認爲這是流量/迭代相關的東西,但我無法設法使其工作。

例如,我有這個簡單的工作:

tFileList - (迭代) - > tTikaExtractor - (onComponentOk) - > tJava - (ROW1) - > tFileOutputJSON

在我的Java組件我只有這個:

String content = (String) globalMap.get("tTikaExtractor_1_CONTENT"); 
row1.content=content; 

但在我的json輸出中,我只有最後一個文件的內容,而不是所有文件的內容!

你能幫助我嗎?

回答

1

這是因爲您沒有將記錄追加到輸出中,因此它將逐個寫入記錄,因此最終只有最後一條記錄在文件中可用。

也許你可以先寫所有的行分隔的文件,然後使用tFileInputDelimited - 主 - tFileOutputJSON

到所有行轉移。

+0

你的意思是tFileOutputDelimited? –

+0

是的,將記錄附加到tFileOutputDelimited,然後使用此組件進行輸入並將所有記錄傳輸到tFileOutputJSON – UmeshR