2011-05-27 33 views
1

我知道我問了幾個相關的Pentaho最近的問題,但我急於在短期內:)Pentaho的勺子 - 等待文件 - 通配符

我,我努力克服最新障礙是對其進行評估我正在構建一個能夠在輸入文件到達時處理輸入文件的作業,但我只知道文件名的格式,而不是確切的文件名,而「等待文件」步驟不允許使用通配符。這似乎是這樣一個步驟的明顯ommision,所以想知道我是否錯過了一些東西,但在論壇等,似乎我不是唯一一個面臨這樣的挑戰。

理想我需要「等待文件」一步一個通配符/正則表達式搜索,並在找到匹配通過生成的文件名在作業處理的下一個步驟。

有什麼建議嗎?

感謝

湯姆

回答

0

再次我試着回答你的問題。

其實,你並不需要一份工作來等待文件。根據我對國家劃分的回答:Pentaho Spoon - Output to multiple files based on field content,您只需要通過源名稱,然後使用進程文件對其進行存檔(請參見下面的圖片)。 Text Input Dialog

從這裏,我認爲你可以使用之前提供的ktr(http://pentaho.phi-integration.com/kettle/kettle-files/split_countries.ktr)來適應我的邏輯。

然後你就可以控制作業使用Job Scheduler(等待和處理文件)的重複(參見圖)。 enter image description here

好了,希望這有助於湯姆!

問候,

恐龍

+0

嗨,再次恐龍! 「在輸出中包含文件名」只是將文件名傳遞給鏈而不是它?即在這種情況下,它會通過「World-Leaders.csv」,但是如果輸入文件並不總是被調用的話呢?我需要嘗試觀察文件夾並處理匹配通配符的文件,例如「* .txt」,以便可以處理具有不同名稱的文件。再次感謝。 Tom – 2011-05-31 08:55:33

+0

嗨湯姆,將通配符放入文本輸入配置中,即正則表達式。那麼一切都應該如你所願。希望能幫助到你。迪諾 – Dino 2011-05-31 16:51:28

+0

再次感謝迪諾。 – 2011-06-02 09:32:16

0

我也有類似的要求,並通過專爲(從遠程主機)接收的文件創建一個目錄解決了這個。

的「獲取文件名」步讀取目錄中的文件並通過名稱下一步。 「獲取文件名」允許通配符,順便說一句。

(關當然,我也來清理輸入隊列,一旦我處理完文件)。

編輯:我沒有提及的是你失去與獲取文件名「喚醒」功能,並您將不得不循環並安排目錄的常規分析。