我現在面臨以下問題:如何在管理數據轉換的同時通過spoon,pentaho中的列合併2個csv文件?
我有兩個輸入:
1)I有35列和它們的適當的頭一個csv基本文件。
2)我有很多給定的文件,不受我控制,可能包含或不包含35列,甚至更糟糕的是,它們可能無序。
我不得不從第二CSV文件中的列匹配的列在第一個CSV文件。如果第二個csv文件沒有全部35列,我應該按照正確的順序創建它們。
一旦我有一個適當的csv文件(其中一個頭部看起來像第一個CSV頭),我將它傳遞給管理數據的列標題引用它們的腳本。
一個可能的解決辦法是讓現有外地輸入的腳本中,但是,我不能這樣做,因爲該領域似乎固定引用第二CSV文件的現有列標題。因此,當我試圖訪問一個不存在的專欄中,我結束了一個異常...
任何幫助將不勝感激!
只是爲了跟進這個問題。我已經放棄了。我使用本地數據庫解決了水壺問題。但是真正解決了我的問題的是我開發的一個小罐子,用於處理水壺外的csv文件。我的朋友仍然在尋找解決方案,因爲他只需要使用水壺=/ – wleao
這在PDI中非常困難。你應該看看元數據注入步驟 - 這可能會做你想做的。實際上,您必須讀取文件,計算出結構,然後將其注入到轉換中,然後讀取文件本身。 – Codek