我試圖從向量提取年齡(數值),tryied以下,但憑着努力R中提取數字值(從自由文本)
例子: -
a <- "age-32 agge32 age 45 aage 56 agee 34"
b <- gsub("[Aa]g.e?"," age ",a)
sa <- strsplit(x=b, split="\\s")
age <- stringr::str_extract(sa, "(age?)(\\s[^\\s]+){1}")
(or)
age <- grep("(([^\\s]+\\s){0}(age)(\\s[^\\s]+){1})",sel,value = TRUE)
如果要提取所有號碼,嘗試'str_extract_all(一,「\ \ d +「)'。 – Lamia
感謝您的早期更新,但實際上自由文本包含其他數字,如日期,地址的地址,Pincode等...我想提取年齡(數字),其後是字符,如「age | agge |年齡|年齡|年齡「例子: - 一個< - 」年齡32 agge32年齡45歲齡56年齡34歲24-06-2015門No.17/7,惠靈頓第三街2100067號「 –
對不起,我的錯誤,要求我只想提取後面跟着字符的年齡(數字),如「age | agge | age- | agee | Age」 a < - 「父親的年齡-52母親agge42兒子的年齡9 Daugther aage 6地址是門23 20002,doc 26-07-1999 pincode 260074「> str_extract(str_extract_all(a,」(?> age | agg)。+?\\ d +「)[[1]],」\\ d +「) 輸出:[1]不適用不適用不適用 預期輸出爲:52 42 9 6 ..需要幫助 –