-1
我試圖從美國NCDC中擦除一些氣候數據,並且它具有不同數量的星號的列以指示空字段。我想用np.nan
替換那些。在數據框中用NaN替換可變數量的星號
我試圖用df.replace
做到這一點,但我正在努力與正則表達式語法來處理字段中星號的可變長度。 我懷疑我需要類似df.replace('?', np.NaN)
但'?'
是正則表達式匹配任何數量的星號。
下面是數據的一個片段:
USAF WBAN YR--MODAHRMN DIR SPD GUS CLG SKC L M ... SLP ALT STP MAX MIN PCP01 PCP06 PCP24 PCPXX SD
0 722543 12977 200601010053 160 6 *** 722 CLR * * ... 1010.9 29.83 1007.2 *** *** 0.00 ***** ***** ***** **
1 722543 12977 200601010153 160 9 *** 722 CLR * * ... 1011.0 29.83 1007.2 *** *** 0.00 ***** ***** ***** **
2 722543 12977 200601010253 160 9 *** 722 CLR * * ... 1011.1 29.83 1007.2 *** *** 0.00 ***** ***** ***** **
3 722543 12977 200601010313 160 10 *** 722 SCT * * ... ****** 29.83 1007.2 *** *** ***** ***** ***** ***** **
4 722543 12977 200601010321 160 10 *** 4 BKN * * ... ****** 29.83 1007.2 *** *** ***** ***** ***** ***** **