2015-02-10 135 views

回答

2

我沒有指導,以指向你,但我可以爲你指明正確的方向來解決這個問題你自己:

  • 不要使用導入導出嚮導 - 這是非常有限在您配置平面文件目標的能力中,它不會允許您修復管道中的數據。
  • 聽起來就像他們想要一個標題行一樣。這意味着您需要確保數據的第一行是。如果您的數據來自SQL,則可以使用UNION完成。即

    SELECT 'Column1' as Column1 
        , 'Column2' as Column2 
    UNION 
    SELECT <actual data from my table> 
    
  • 將平面文件連接管理器通過

  • 您可以使用派生列或腳本任務,把引號特殊的「第一個數據行中列名」檢查有標題行在文本字符或報價:

    - "Special character in non-quoted text ← make sure unusual text is always quoted" 
    - "stray quotes – standalone double or single quote in the middle 
    of non-quoted text, or non-escaped quotes in quoted text ← escape 
    or remove stray quotes" 
    

每鏈接中的建議,您可以使用CSVkit或爸爸解析來檢查你最後的問題在嘗試將其上傳到neo4j之前,您可以使用CSV文件。通常,這些數據質量問題是特定於您的域的,一旦少數問題得到解決,就不需要進一步照顧和餵養。