stringr

3熱度

4回答

我知道所有的問題關於添加leading zero和全面響應爲他們提供諸如Q1，Q2，Q3。但對我來說，至少根據我目前所知，我不能夠解決什麼，我要做的事情如下：添加leading zero使用regex模式匹配所以一個string，我想在-之後將leading zero僅添加到digits。例如： Sam <- c("222-88", "537-457", "652-1", "787-892

2熱度

1回答

正則表達式查找包含空格和標點符號

我會通過一個包含有此格式示例文本值（地名）的數據集精確匹配： M.Joan (13-2) A.Alfred (20-13) F.O'Neil (12-231) D.Dan Fun (23-3) T.Collins (51-82) J.Maddon (12-31) 一些字符串有兩個名字，就象一個 M.Joan (13-2) A.Alfred (20-13) 我只想從字符串中提取名稱。

0熱度

1回答

替換以句點開頭的單詞

我正在嘗試修正具有一些十進制數字錯誤輸入錯誤的數據集。例如，一些條目被鍵入爲「.15」而不是「0.15」。目前這個列是chr，但後來我需要將其轉換爲數字。我試圖選擇所有以「句點」開頭的「單詞」。並用「0」代替期限。但似乎用於錨定字符串開頭的「^」不適用於該句點。我試着用： dataIMN$precip <- str_replace (dataIMN$precip, "^.", "0.")

0熱度

2回答

如何保留包含「。」的用戶名當我使用stringR函數？

我希望能夠隔離instagram用戶的用戶名，我一直使用@符號作爲標識頁面源中用戶的方式。我的問題是，當一個用戶的名字包括一個。，我的代碼將刪除所有的東西，給我不完整的用戶名。我需要的是完整的用戶名，即保留所有用戶名，直到發生空白。 web_page_read <- read.csv('https://www.instagram.com/p/BY0i2O0FxHl/') colnam

1熱度

1回答

使用dplyr/tidyr方法提取字符串及其位置

輸入數據框有三個id列和一個raw_text。 u_id對應於用戶，doc_id對應於特定用戶的文檔，並且句子ID對應於用戶文檔內的句子。 df <- data.frame(u_id=c(1,1,1,1,1,2,2,2), doc_id=c(1,1,1,2,2,1,1,2), sent_id=c(1,2,3,1,2,1,2,1), text=c("a

1熱度

1回答

清潔froum後在rvest多個報價+ stringr

我颳了很長的論壇主題，我想拿出有包含以下信息列的數據庫：日期/全文後文/報價用戶/引用文本/清潔文本乾淨的文字應該是每個用戶的帖子，沒有報價，如果他們回覆給任何人。如果該帖子不是回覆，我會將其保留爲不適用。下面是一個發明後，與發明了用戶，說明我已經設法到目前爲止做： post<-"Meow1 wrote: »\noday is gonna be the day that they're gonn

0熱度

1回答

字符串匹配

我有一個數據框有兩列，它們是人的名字。生成表下面的代碼： names.1=c('Ron ven goh','Phil Mick' , 'Rohan Aggarwal','John Deo Lin') names.2=c('Rob ven goh','kitty Mol','Tejas Aggarwal','Jorge Mol Lin') df=data.table(names.1,names.

3熱度

2回答

用字長替換字符串中的標點符號在R

我有一個data.frame與大量的（冗長）字符串。在處理它們之前，我試圖對它們進行一些清理，但在處理期間時遇到了問題。我希望能夠區分句子用於結束句子和何時用作縮寫詞的一部分。我希望通過這個詞的長度來做到這一點，但還沒有找到正確的正則表達式。說我有這樣的字符串：mystring <- "hello.world from the u.s.a."。我想用"hello world from the u

1熱度

1回答

在stringr中使用str_match

我有很多文本文件。在每個文本文件中，有一個感興趣的部分（如下）： <tr> <td ><b>發起時間</b></td> <td colspan="2" style="text-align: left">2015-04-08</td> <td style="width: 25%;"><b>回報機制</b></td> <td colspan="2" st

0熱度

3回答

嘗試使用|創建字符串的值或運營商

我想刮一個網站的鏈接。到目前爲止，我下載了文本並將其設置爲數據框。我有下面的問題。 keywords <- c(credit | model) text_df <- as.data.frame.table(text_df) text_df %>% filter(str_detect(text, keywords)) 其中信貸和模型兩個值我想搜索的網站，即回報排在字信用卡或模型。