我有一個包含由0,1大量字符串的數據幀使用正則表達式的匹配,和N.以下是幾個例子:模式中的字符串
a = "10000000011111111"
b = "11111111111111111"
c = "11111110000000NNN"
d = "00000000000000000"
e = "00000001111111111"
f = "11111000000000000"
進出口尋找用於識別僅包含'0'和'1'而不包含'N'的字符串的方式。我的最終目標是在發生這種情況的地方替換成原始數據框'REC'。與此question中所做的相似。
從我上面的數據結果將是:
a = "REC"
b = "11111111111111111"
c = "11111110000000NNN"
d = "00000000000000000"
e = "REC"
f = "REC"
達到我的目的主要戰略伊夫使用(從以前的問題被答覆的指導下)使用gsub
但我不能讓一個正則表達式,將工作爲我的期望輸出。我試過太多的反覆嘗試在這裏,但這裏是我的最新的功能如下:
markREC <- function(X) {
gsub(X, pattern = "^(0)+.*(1)+$",
replacement = "REC?")}
此功能將數據幀與lapply
運行的其他戰略我用盡依賴strsplit
但我很難得到這個工作。如果有人願意看到他們,我可以舉例說明。我想這對於那裏的一些正則表達式專家來說很簡單,但經過數小時的嘗試,我愛一些幫助!
這並不完全奏效,因爲它拿起那只有0或只有1個,其ID喜歡串排除此組。我編輯了我想要的輸出的問題。 –
@SamGlobus其實這完美的作品。我不確定你在說什麼。 – FailedDev
只是對於類似於雙引號中的字符串。字符串將在數據框架中,並且將具有不同的長度。 –