stringr

    3熱度

    4回答

    我知道所有的問題關於添加leading zero和全面響應爲他們提供諸如Q1,Q2,Q3。 但對我來說,至少根據我目前所知,我不能夠解決什麼,我要做的事情如下: 添加leading zero使用regex模式匹配 所以一個string,我想在-之後將leading zero僅添加到digits。 例如: Sam <- c("222-88", "537-457", "652-1", "787-892

    2熱度

    1回答

    我會通過一個包含有此格式示例文本值(地名)的數據集精確匹配: M.Joan (13-2) A.Alfred (20-13) F.O'Neil (12-231) D.Dan Fun (23-3) T.Collins (51-82) J.Maddon (12-31) 一些字符串有兩個名字,就象一個 M.Joan (13-2) A.Alfred (20-13) 我只想從字符串中提取名稱。

    0熱度

    1回答

    我正在嘗試修正具有一些十進制數字錯誤輸入錯誤的數據集。例如,一些條目被鍵入爲「.15」而不是「0.15」。目前這個列是chr,但後來我需要將其轉換爲數字。 我試圖選擇所有以「句點」開頭的「單詞」。並用「0」代替期限。但似乎用於錨定字符串開頭的「^」不適用於該句點。 我試着用: dataIMN$precip <- str_replace (dataIMN$precip, "^.", "0.")

    0熱度

    2回答

    我希望能夠隔離instagram用戶的用戶名,我一直使用@符號作爲標識頁面源中用戶的方式。 我的問題是,當一個用戶的名字包括一個。,我的代碼將刪除所有的東西,給我不完整的用戶名。 我需要的是完整的用戶名,即保留所有用戶名,直到發生空白。 web_page_read <- read.csv('https://www.instagram.com/p/BY0i2O0FxHl/') colnam

    1熱度

    1回答

    輸入數據框有三個id列和一個raw_text。 u_id對應於用戶,doc_id對應於特定用戶的文檔,並且句子ID對應於用戶文檔內的句子。 df <- data.frame(u_id=c(1,1,1,1,1,2,2,2), doc_id=c(1,1,1,2,2,1,1,2), sent_id=c(1,2,3,1,2,1,2,1), text=c("a

    1熱度

    1回答

    我颳了很長的論壇主題,我想拿出有包含以下信息列的數據庫:日期/全文後文/報價用戶/引用文本/清潔文本 乾淨的文字應該是每個用戶的帖子,沒有報價,如果他們回覆給任何人。如果該帖子不是回覆,我會將其保留爲不適用。下面是一個發明後,與發明了用戶,說明我已經設法到目前爲止做: post<-"Meow1 wrote: »\noday is gonna be the day that they're gonn

    0熱度

    1回答

    我有一個數據框有兩列,它們是人的名字。生成表下面的代碼: names.1=c('Ron ven goh','Phil Mick' , 'Rohan Aggarwal','John Deo Lin') names.2=c('Rob ven goh','kitty Mol','Tejas Aggarwal','Jorge Mol Lin') df=data.table(names.1,names.

    3熱度

    2回答

    我有一個data.frame與大量的(冗長)字符串。在處理它們之前,我試圖對它們進行一些清理,但在處理期間時遇到了問題。我希望能夠區分句子用於結束句子和何時用作縮寫詞的一部分。我希望通過這個詞的長度來做到這一點,但還沒有找到正確的正則表達式。 說我有這樣的字符串:mystring <- "hello.world from the u.s.a."。我想用"hello world from the u

    1熱度

    1回答

    我有很多文本文件。在每個文本文件中,有一個感興趣的部分(如下): <tr> <td ><b>發起時間</b></td> <td colspan="2" style="text-align: left">2015-04-08</td> <td style="width: 25%;"><b>回報機制</b></td> <td colspan="2" st

    0熱度

    3回答

    我想刮一個網站的鏈接。到目前爲止,我下載了文本並將其設置爲數據框。我有下面的問題。 keywords <- c(credit | model) text_df <- as.data.frame.table(text_df) text_df %>% filter(str_detect(text, keywords)) 其中信貸和模型兩個值我想搜索的網站,即回報排在字信用卡或模型。