0
我在數據框中有四列數據。這些列根據北/南/東/西拆分(NO記錄存在於多於一列中)來指定記錄(行)是否位於倫敦的4個不同部分內,因此(其中第一行是列標題) :使用R和tidyr從NAs中提取文本()
North South East West
NA South NA NA
NA NA East NA
North NA NA NA
我想用這些作爲一個圖表中的一個因素,因此,使用tidyr我串接他們
LondonNew <- unite(London,"adminarea",North:West,sep="",remove=FALSE)
,所以,我現在有一個附加列名爲adminarea:
adminarea
NASouthNANA
NANAEastNA
NorthNANANA
我無法在tidyr()中找到一個理由來忽略NAs,並懷疑這是否可能?最壞的情況下,有人可以幫助我一個簡單的額外的正則表達式/ str_extract,這將幫助我只提取北,南,東或西四個單詞到一個單獨的列?
的目標是有:
adminarea
South
East
North
的幫助非常感謝。
使用LondonNew $ adminarea < - gsub('NA','',LondonNew $ adminarea) – Gopala
它可以在這種情況下工作,但並不總是如果文本的其他部分也有NA。 – Gopala
這是一個矩陣索引的經典案例 - 'dat [cbind(seq_len(nrow(dat)),max.col(!is.na(dat)))]''將執行所有'unite'加'NA'的移除一氣呵成。 – thelatemail