我有一些文件上傳到Google雲端存儲(csv和json)。Bigquery創建Google雲端存儲(本地或外部)鏈接
我可以創建BigQuery表,本地或外部鏈接到Google雲端存儲中的這些文件。
在創建bigquery表的過程中,我可以檢查「架構自動檢測」。
「Schema Automatically detect」適用於json新行分隔的格式文件。但是對於csv文件,第一行是'列名',bigquery不能執行「模式自動檢測」,它將第一行視爲數據,然後創建的模式bigquery將爲string_field_1,string_field_2等。
是否有什麼,我需要爲我的CSV文件,使大量查詢「模式自動檢測」做工程
CSV文件我已經是「Microsoft Excel的逗號分隔值文件」
更新:?
如果第一列是空的,BigQuery autod etect不檢測頭
custom id,asset id,related isrc,iswc,title,hfa song code,writers,match policy,publisher name,sync ownership share,sync ownership territory,sync ownership restriction
,A123,,,Medley of very old Viennese songs,,,,,,,
,A234,,,Suite de pièces No. 3 en Ré Mineur HWV 428 - Allemande,,,,,,,
但是,如果第一列不爲空 - 這是確定:
custom id,asset id,related isrc,iswc,title,hfa song code,writers,match policy,publisher name,sync ownership share,sync ownership territory,sync ownership restriction
1,A123,,,Medley of very old Viennese songs,,,,,,,
2,A234,,,Suite de pièces No. 3 en Ré Mineur HWV 428 - Allemande,,,,,,,
不應成爲BigQuery的功能改進要求?
我試過一些其他的csv文件。他們在工作。這與csv文件本身有關。 – searain
如果你可以分享這個CSV文件,或者只是它的一些代碼片段來重現問題,那真的很有幫助。 –