2016-06-16 66 views
0

我已加載本地文件到了Talend過程,需要做以下條件這個文件數據如何通過Talend工作刪除減號和加號重複?

下面我csv文件數據顯示,像

NO,DATE,MARK 
123,2015-03-01,200  
123,2015-03-01,-200  
123,2015-03-01,200  
123,2015-03-01,200 
125,2016-01-01,80 

這裏以上availed "200""-200"兩個值。如果我有-200 我需要的,如果我有同樣的NO,DATE,MARK然後我需要刪除重複2

" 123,2015-03-01,200"," 123,2015-03-01,200" = " 123,2015-03-01,200"

最後我的成績應該來像下面

NO,DATE,MARK 
123,2015-03-01,200 
125,2016-01-01,80 

後後刪除相應的+200值我需要一些200 + 80 = 125,2016-01-01,280。如何使用talend工作來完成上述過程。

+0

你的例子似乎關閉:最後2行有不同的數字,你確定他們需要添加?也就是說,我建議你只要按照最後2行的方式進行操作:按順序將它們全部添加,然後發送無論您需要發送到的結果(無法告訴您如何執行該操作在Talend,但我懷疑這個問題是特別的,你會有特別的支持)。 – Thomas

+0

嗨,幫我幾件@托馬斯 – user6474683

+0

_you_嘗試了什麼?如果您是計算機,您將如何處理數據(即,想想計算機有限的信息,並且只使用這些信息以及基本規則)? – Thomas

回答

0

一步一步來,我們就可以通過刪除此啓動:

123,2015-03-01,200  
123,2015-03-01,-200 

,我們可以通過NODATE分組使用了Talend compoenet tAggregateRow後總結MARK做到這一點。之後,我們將得到:

123,2015-03-01,0 

現在我們可以使用該組件tFilterRow以除去MARK == 0所有行,和組件tUniqRow刪除重複的行。

最後一步是使用tAggregateRow得到的MARK總和並將其存儲在一個上下文變量,然後通過使用組件tSortRow得到最大NO和最新DATE,然後得到的只是使用tSampleRow該行。我們可以影響MARK的總和。

+0

太好了。謝謝。我會嘗試@ 54I3d – user6474683