2017-05-19 62 views
0

我有一個帶雙引號分隔時間戳和電子郵件字段的CSV文件,例如在Talend中導入CSV雙引號分隔列被忽略

Timestamp,Email 
"2017-01-01 00:00:01",[email protected] 
"2017-01-01 00:02:31",[email protected] 

我已經爲CSV文件定義了元數據源,並且它能夠正確識別並鍵入這兩列。但是,當我執行包時,它會將時間戳記列視爲不存在(通常出現'Unparseable date:「[email protected]」''錯誤)

我試圖改變tFileInputDelimited包括轉義和文本框選項以及導入時間戳作爲日期和字符串的設置數(如果我將其作爲字符串導入,時間戳字段具有電子郵件地址,並且電子郵件地址爲空),但我無法獲取導入以識別雙引號分隔時間戳列的存在。

我假設我已經做了一件讓它逃避整個時間戳值的事情,但我想不出可能是什麼。

+0

雙引號來自於mailchimp提取。我對輸入格式沒有任何控制。 –

+0

我通過重置組件來使用存儲庫中定義的元數據來解決問題,但這些其他解決方案是有效。 –

回答

1

如果你真的想保持周圍時間戳雙引號中輸入文件,試試這個日期模型

"\"yyyy-MM-dd HH:mm:ss\"" 

這種方式,您可以指定需要雙引號(\「)中輸入字符串。

+0

雙引號來自mailchimp提取。我無法控制輸入文件的格式,禁止在Talend中修改它們。 –

+0

雖然這是一個聰明的想法 - 如果我還沒有解決它,我會用這個解決方案。 –

1

如果你可以改變輸入數據時,您應該啓用所有的字段或無報價。

如果這是沒辦法,你也可以閱讀tFileInputFullRow文件,刪除引號w^ith一個字符串替換可能,然後用tDenormalize將數據處理成列數據。

1

如果使用元數據,則:

  1. 確保組分指的是存儲庫(成分 - >屬性類型=庫)
  2. 修改元數據以改變文本外殼字符「 \「」
相關問題