我有twitter數據。使用庫(stringr)我已經提取了所有的網頁鏈接。但是,當我嘗試做同樣的事情時,我得到錯誤。前幾天相同的代碼已經工作。以下是代碼:從twitter中提取hashtags - 在R中輸入字符串
library(stringr)
hash <- "#[a-zA-Z0-9]{1, }"
hashtag <- str_extract_all(travel$texts, hash)
以下是錯誤:
Error in stri_extract_all_regex(string, pattern, simplify = simplify, :
Error in {min,max} interval. (U_REGEX_BAD_INTERVAL)
我已經重新安裝stringr包....但於事無補。
,我用網絡鏈接的代碼是:
pat1 <- "http://t.co/[a-zA-Z0-9]{1,}"
twitlink <- str_extract_all(travel$texts, pat1)
的reproduceable示例如下:
rtt <- structure(data.frame(texts = c("Review Anthem of the Seas Anthems maiden voyage httptcoLPihj2sNEP #stevenewman", "#Job #Canada #Marlin Travel Agentagente de voyages Full Time in #St Catharines ON httptconMHNlDqv69", "Experience #Fiji amp #NewZealand like never before on a great 10night voyage 4033 pp departing Vancouver httptcolMvChSpaBT"), source = c("Twitter Web Client", "Catch a Job Canada", "Hootsuite"), tweet_time = c("2015-05-07 19:32:58", "2015-05-07 19:37:03", "2015-05-07 20:45:36")))
你能提供一些重複的例子 – akrun
RTT < - 結構(data.frame(文本= C(「海洋國歌審查國歌首航httptcoLPihj2sNEP #stevenewman 「,#Job #Canada #Marlin旅行代理商全日制在#St Catharines ON httptconMHNlDqv69」,「體驗#Fiji amp #NewZealand前所未有的美好的10晚航行4033 pp離開溫哥華httptcolMvChSpaBT」), source = c (「Twitter Web客戶端」,「趕上加拿大工作」,「Hootsuite」), tweet_time = c(「 2015-05-07 19:32:58「,」2015-05-07 19:37:03「,」2015-05-07 20:45:36「))) – Apricot
請在您的帖子中更新此信息,而不是在評論 – akrun