stringr

    1熱度

    1回答

    第一個匹配的文本詞典術語我有條款 terms <- c("hello world", "great job") terms <- as.data.frame(terms) 一本字典,我想尋找額外data.frame第一場比賽包含文件 doc <- c("i would like to say hello worlds", "hey friends hello world everyone",

    1熱度

    2回答

    我有兩個數據集稱爲A和B. library(data.table) Farm.Type <- c("Fruits","Vegetables","Livestock") Produce.All <- c("Apple, Orange, Pears, Strawberries","Broccoli, Cabbage, Spinach","Cow, Pig, Chicken") Store <-

    0熱度

    2回答

    這是一個關於學校的問題,但我一直在努力一段時間,只需要一個正確的方向。我不是要求完整的答案。 我被給了一個數據框與學生成績進行各種評估。我必須編寫一個函數,這個函數會導致提供名稱的評估的重量(作爲總分100%的一部分)。該功能需要至少包含一個輔助功能。 我首先提供有以下幾行代碼來運行,這類()定義爲一個功能: assessmentTypeWeights <- c(5,15,5,3,2,10,10,

    3熱度

    1回答

    我想從url中獲取連接文本文件,但我不知道如何做到這一點與HTML和不同的文件夾? 這是我試過的代碼,但它只列出了文本文件並且有很多html代碼,如this我該如何解決這個問題,以便我可以將文本文件合併到一個csv文件中? library(RCurl) url <- "http://weather.ggy.uga.edu/data/daily/" dir <- getURL(url, dirl

    1熱度

    2回答

    我有一個大數據表,我要檢查103a_foo是否存在。但是,大表格中的文件名會以不同的方式寫入,所以我必須使用正則表達式。 dt = structure(list(myID = c("86577", "34005","34005", "194000", "30252", "71067"), filename = c("/scratch/tmpdir/12a_foo.mzXML.gz", "/s

    0熱度

    1回答

    我試圖從字符串中提取一些單詞(國家名稱)。該字符串列表中的元素,例如, myList <- list(associations = c("Madeup speciesone: \r\n\t\t\t\t", "Foobarae foobar: Russia - 123,", "Foobarus foobar France - 7007,Italy - 7007,Portuga

    0熱度

    1回答

    我想提取給定字符串中的最後4位數字,但無法弄清楚。最後4位數字可以是「XXXX」或「XXXX-」。最終,我有一份包括單年(即2001年或2001年),年份列表(即2001年,2004年),年份範圍(即2001年至2010年)或這些組合在結尾處有或沒有破折號(「 - 」)。 我意識到'$'是標識END的標記,'^'用於標識正則表達式中的START。我能夠輕鬆提取FIRST 4。下面是什麼我可以做一個

    1熱度

    3回答

    我想寫一個正則表達式表達(R下)匹配所有包含在本文中3個字母的單詞: tex= "As you are now so once were we" 我第一次嘗試是選擇包含單詞3個字母用空格包圍: matches=str_match_all(tex," [a-z]{3} ") 它應該匹配「你」,「是」和「現在」。但是,因爲一些這些空間都匹配的字符串之間共享,我只得到「你」和「現在」。 有沒有辦

    0熱度

    2回答

    我只是在學習科學數據提取[R在data.table列從文本的數字,並用幾行從數據中提取號碼(使用data.table): library(stringr) library(data.table) prods[, weights := str_extract(NombreProducto, "([0-9]+)[kgKG]+")] prods[, weights := str_extract(w

    2熱度

    2回答

    樣本數據 files.in.path = c("a.4.0. name 2015 - NY.RDS", "b.4.0. name 2016 - CA.RDS", "c.4.0. name 2015 - PA.RDS") strings.to.find = c("4.0", "PA") 欲表示包含所有strings.to.find所有元素的邏輯向量。結果想: