我有一個數據框,其中包含一列文本。我需要捕捉某個短語後面的數字(可能是最可能的1到4位數字的任意位數),即'樓層面積'或'樓面面積'。我的數據看起來類似以下內容:在R中提取特定文本中的一個數字
"A beautiful flat on the 3rd floor with floor area: 50 sqm and a lift"
"Newbuild flat. Floor Area: 30 sq.m"
"6 bed house with floor area 50 sqm, lot area 25 sqm"
如果我嘗試只提取次數,或者我從平方米回頭我有時會得到通過mistake.If人的很多區域可以幫我一個超前的正則表達式或在stringr類似,我會很感激。正則表達式對我來說是一個弱點。提前謝謝了。
爲什麼要使用前瞻/後視?使用stringr'str_match(df,「(?i)\\ bfloor area:?\\ s *(\\ d +)\\ s * sq」)'並獲得第二列值('[,2]'): '> str_match(v,「(?i)\\ bfloor area:?\\ s *(\\ d +)\\ s * sq「)[,2] // [1]」50「」30「」50「' –