2012-04-17 85 views
1

我有一個標準化表。我想從該表的一個特定列中選擇所有值,並將該列中的唯一值加載到單獨的表中。如何使用pentaho壺從一組行中找到唯一值?

如何做到這一點使用Pentaho的勺子?請注意,我是勺子的新手。在我的人生中,我只嘗試過你好世界的轉變。

我已經表命名爲「員工」,這有很多的列如下(我沒有給無關這裏列):

+-------------------------------------------------------+ 

          Employees 
+-------------------------------------------------------+ 

employee_number | employee_name | deputed_branch | phone 

+-------------------------------------------------------+ 

現在我只想獨特的分支名稱進入使用名爲branches新表勺。

'分支' 表將類似於以下內容:

+-------------------------------------------------------+ 

          branches 
+-------------------------------------------------------+ 

| branch_id | branch_name 

+-------------------------------------------------------+ 

其中branch_id將是獨一無二的,自動遞增。

要連接Employeesbranches表,我將使用Employee_branch表,該表將包括employee_numberbranch_id列。

誰能告訴如何做到這一點?

在此先感謝!

回答

3

你就不能這樣做,在SQL?

選擇員工

如果沒有明顯的deputed_branch;然後使用唯一行步驟(並非它必須是已排序的數據)或逐組。 (也排序)

或;如果行數很少,則按內存分組排序(數據不需要排序)