gsub

    1熱度

    2回答

    刪除< and >之間的所有字符我有一個​​字符串: a="<gml:posList srsDimension=\"2\" count=\"5\">7 -5.067 -3 56.7 -3.3 58.3 -5.65 57 -8.33</gml:posList>" ,並希望GSUB的<和>之間的一切,到現在無濟於事至今。我想只剩下數字(即7 -5 -3 56 -3 58 ...),我可以在其中處理

    2熱度

    4回答

    提取3位數字,我有以下數據 data <- data.frame(make=c("af455f5","255tfd4d3","ojt100","12unin234mimo24","sh469dh","6ht6k778k9","kjh457"), type=c("a","a","a","a","b","a","b")) 我只希望從「製造」的元素中提取任何三位數如果相應的類型是「A

    2熱度

    2回答

    在R分析感傷分析的Facebook評論。表情符號在<>符號之間的文本中編碼。 實施例: "Jesus te ama!!! <U+2764> Ou não...?<U+1F628> (fé em stand by)" <U+2764>和<U+1F628>(分別爲重黑色心臟和恐懼的臉, )是表情符號。 因此,除了表情符號代碼,我需要分割文字/數字和標點/符號。 我所做的,使用GSUB功能,這一點:

    -1熱度

    1回答

    我很困惑,爲什麼這不能按預期工作。 d = "936589_WI_RAPIDS_STREET_DEPT" f=d.gsub('/936*[0-9]_/',' ') # => "936589_WI_RAPIDS_STREET_DEPT" 我本身測試我正則表達式,它給了我想要的輸出: "WI_RAPIDS_STREET_DEPT"

    1熱度

    4回答

    我有一個只包含對"-"一邊一個數字,比如一個字符串: "1-3" 我想得到這樣 "01-03" 因此如果字符串上的一側有兩個數字破折號如: "1-10" 然後我不想做任何替換。我可以做一個gsub表達類似 str.gsub!(/(^|[^\d]])\d[[:space:]]*\-[[:space:]]*\d([^\d]|$)/, '\1') ,但我不清楚怎麼做,如果有多個(例如,兩

    2熱度

    3回答

    我想gsub在河中的字符串提到例如尺寸的模式: "16 x 13 x 12 inch box" "1x2x3 pipe" "123x 23 x334 asd" 預期輸出: "inch box" "pipe" "asd" 什麼我有到目前爲止這個表達式是:[0-9]*\\s*x\\s*。我怎樣才能使它成爲重複的模式匹配?

    1熱度

    1回答

    我正在使用Rails 5.我想要替換任意數量的數字,可選數量的空格,字符串數組中的一個標記,可選數量的空格以及任意數量的數字的字符串中的出現次數。因此,例如,這將符合我的模式.... 123/2221111 或本 102849/222 ,所以我想我的正則表達式應該是 re = /\d+[[:space:]]*[#{Regexp.union(TOKENS)}][[:space:]]*\d+/

    0熱度

    1回答

    獨特的法律符號我要清理字符串,使他們能夠解析爲唯一合法的符號。我打算清理很多字符串,因此在輸出中存在重複符號的不良風險。採取每個非法字符並用其基本32編碼取代它就足夠了。所需的行爲: sanitize("_bad_symbol$not*a&list%$('") ## [1] "L4bad_symbolEQnotFIaEYlistEUSCQJY" 我想我需要的是可能的字符grep的完整列表。我

    0熱度

    1回答

    之外的所有字符串 我正在嘗試清理類項目的數據。這些數據涉及從1950年到2011年的NOAA Storm數據。風暴類型(EVTYPE)只應該是48個不同的級別,但是有超過1000個獨特的條目。我試圖找到所有的雪相關的條目,這給了我: table(grep("snow", temp$EVTYPE, ignore.case = TRUE, value = TRUE)) ACCUMULATE

    0熱度

    2回答

    我有很多錯誤消息,我正在嘗試清理。 一些錯誤結束與文本"(sec): 0.xxx" 我想要使用GSUB(秒)後,除去一切 data$Message <- gsub("(sec).*", "", data$Message, perl = TRUE) 這一切返回後( 我知道這會很容易只是使用「:」或「)」,但它會影響其他我不想改變的錯誤。 有沒有辦法使用gsub來查看幾個字符 - 比如「(sec)