我有以下的列數據幀之間沒有空格欄,分裂時,有兩個詞
Ann
Intergenic
exon (ENS, exon 2 of 2)
promoter-TSS (ENST)
TTS (ENST0)
intron (ENST, intron 1 of 1
和我的目標在列安分成Ann1這樣,
Ann Ann1
Intergenic Intergenic
exon (ENS, exon 2 of 2) exon
promoter-TSS (ENST) promoter-TSS
TTS (ENST0) TTS
intron (ENST, intron 1 of 1) intron
所以我試過,
df["Ann1"]=df['Ann'].apply(lambda x: x.split('\s'))
df["Ann1"]
[Intergenic]
1 [exon (ENST, exon 2 of 2)]
4 [promoter-TSS (ENST)]
5 [TTS (ENST)]
6 [intron (ENST, intron 1 of 1)]
但它看起來像空間不是「空間」喜歡分裂它。任何建議將是巨大的
Soory也是我能做到這樣,最終[ '註釋']適用。(拉姆達X:x.split( ' ')[0]) – user1017373
是,'終[' 註釋']適用。 (lambda x:x.split()[0])也可以工作,但如果有一些'NaN',則失敗。但是,如果沒有NaN是可能的使用它。 – jezrael
您可以通過將'n = 1'參數傳遞給'split'來確保它只會嘗試在第一個空白處進行分割,從而使處理器免於工作。 'df [「Ann1」] = df ['Ann']。str.split(n = 1).str [0]' – piRSquared