2
我想創建一個Spoon
轉換,它可以處理列的多個值。 我的轉換輸入是一個CSV文件。在該CSV文件中,有一列名爲'Technology',其中包含0個或更多個由分號分隔的值,如下所示。如何拆分Pentaho Spoon中的列的值?
+------------------------------------------------------+
row_id | Technology
+------------------------------------------------------+
1 | Cobol ; Db2 ; Jcl ; Vsam ; Cics ; Changeman ;
2 | Oracle ; Sql ; Db2 ; Oracle 9i ;
3 | Windows 2000 ; SQL ;
+------------------------------------------------------+
我有一個數據庫表名爲「技術」和它的模式如下:
+----------------------+
Technologies
+----------------------+
id | technology_name
+----------------------+
其中id
列設置爲自動遞增。
我想插入technology
列的值,只有當該值不存在於Technologies
表中時。
誰能告訴我
1)哪些類型的步驟,以用來分裂technology
列的值? 2)如何只插入一次值?例如在row 1
和row 2
,Db2
重複,但我只想插入Db2
一次。
在此先感謝!