我在BigQuery中有以下基因表(超過12K行)。在PIK3CA_features(列2)的長列表中與同一sample_id(第1列)bigQuery - 如何使用行值爲新表創建列
Row sample_id PIK3CA_features
1 hu011C57 chr3_3930069__TGT
2 hu011C57 chr3_3929921_TC
3 hu011C57 chr3_3929739_TC
4 hu011C57 chr3_3929813__T
5 hu011C57 chr3_3929897_GA
6 hu011C57 chr3_3929977_TC
7 hu011C57 chr3_3929783_TC
我想生成如下表:
Row sample_id chr3_3930069__TGT chr3_3929921_TC chr3_3929739_TC
1 hu011C57 1 1 0
2 hu011C58 0
含義,一個排對於每個樣本ID和1/0,如果PIK3CA_feature存在於此樣本。
任何想法如何輕鬆地生成此表?
非常感謝您的任何想法!