我是Pentaho的新手,正在嘗試讀取CSV文件(我已經這樣做)並根據標識符創建數據塊。如何使用Pentaho將CSV文件分成組?
例如
1|A|B|C
2|D|E|F
8|G|H|I|J|K
4|L|M
1|N|O|P
4|Q|R|S|T
5|U|V|W
我需要拆分和基本爲這樣:
(每個塊開始時在第一列等於 '1')
塊a)
1|A|B|C
2|D|E|F
8|G|H|I|J|K
4|L|M
B座)
1|N|O|P
4|Q|R|S|T
5|U|V|W
如
a |1|A|B|C
a |2|D|E|F
a |8|G|H|I|J|K
a |4|L|M
b |1|N|O|P
b |4|Q|R|S|T
b |5|U|V|W
怎麼可以這樣使用Penatho實現?謝謝。
我發現了一個類似的問題,但答案並不真正幫助我的情況下 Pentaho Kettle split CSV into multiple records
這是不規則的CSV數據。首先它是不正確的;其次它是位置的(意味着行需要知道它們相對於其他行的位置)。你可能最好用JavaScript來處理它。你能更詳細地說明你將要對每個街區做什麼嗎?也許還有另一種方法。 –
您是否需要將不同的塊保存到不同的文件中? – bolav
@ Brian.D.Myers我需要處理id(每個塊內的行連接的管道分隔值),並使用它從數據庫中提取數據。然後,我將需要該數據塊根據數據庫中的數據生成報告。 –