1
我想用Google Datalab筆記本爲基因組數據創建一個bigQuery表,並達到列限制。該表由熊貓DataFrame
創建。來自dataframe的BigQuery表
# to communicate with Google BigQuery
from pandas.io import gbq
gbq.to_gbq(df_pgp_input, 'pgp_orielresearch.pgp_PIK3CA_all_ml', 'speedy-emissary-167213', chunksize=10000, verbose=True)
GenericGBQException:原因:無效消息:字段太多:12427
唉,添加STRUCT將無濟於事,因爲無論結構如何,10000個限制都在葉子字段的總數上。 –
嗨@MoshaPasumansky,我不知道OP是否爲每列創建了一個帶有STRUCTS的ARRAY,如果它能正常工作,通過一些關鍵字來聚合。對於我在這裏測試的內容,我可以非常容易地創建帶有100k STRUCT的ARRAY(而不是在結構中創建10k個鍵,爲每一列創建一個具有每列結構的數組)。 –