我颳了很長的論壇主題,我想拿出有包含以下信息列的數據庫:日期/全文後文/報價用戶/引用文本/清潔文本 乾淨的文字應該是每個用戶的帖子,沒有報價,如果他們回覆給任何人。如果該帖子不是回覆,我會將其保留爲不適用。下面是一個發明後,與發明了用戶,說明我已經設法到目前爲止做: post<-"Meow1 wrote: »\noday is gonna be the day that they're gonn
我有一個data.frame與大量的(冗長)字符串。在處理它們之前,我試圖對它們進行一些清理,但在處理期間時遇到了問題。我希望能夠區分句子用於結束句子和何時用作縮寫詞的一部分。我希望通過這個詞的長度來做到這一點,但還沒有找到正確的正則表達式。 說我有這樣的字符串:mystring <- "hello.world from the u.s.a."。我想用"hello world from the u