我想查看使用R(追隨者> 100000)的用戶的Twitter追隨者的個人資料。雖然twitteR是一個很好的軟件包,但在處理高層次的追隨者時會遇到問題,因爲需要實施睡眠例程以避免超出費率限制。我在這裏是一個相對的新手,並想知道如何循環訪問ID對象,以批處理方式輸入100(因爲這是Twitter API一次可以處理的最大值)?在R的查找Twitter追隨者
編輯:代碼添加 特(Twitter) 庫(plyr) maxTwitterIds = 100 休眠時間= 500秒#
user<-getUser("[username]")
followers<-zz$getFollowerIDs()
ids_matrix = matrix(zz, nrow = maxTwitterIds, ncol = length(zz)/maxTwitterIds)
followers<-zz$getFollowerIDs()
#note: for smaller lists of followers it is possible to use the command "lookupUsers(zz) at this point
foll<-getTwitterInfoForListIds = function(id_list) {
return(lapply(id_list,
names <- sapply(foll,name)
sn<sapply(foll,screenName)
id<-sapply(foll,id)
verified<-sapply(foll,erified)
created<-sapply(foll,created)
statuses<-sapply(foll,statusesCount)
follower<-sapply(foll,followersCount)
friends<-sapply(foll,friendsCount)
favorites<-sapply(foll,favoritesCount)
location<-sapply(foll,location)
url<-sapply(foll,url)
description<-sapply(foll,description)
last_status<-sapply(foll,lastStatus)))
}
alldata = alply(, 2, function(id_set) {
info = getTwitterInfoForListIds(id_set)
Sys.sleep(sleeptime)
return(info)
})
我想在http://cran.r-project.org/web/packages/twitteR/twitteR.pdf的第6頁,你可以找到很好的信息。 – aatrujillob 2012-02-08 15:04:07
是的,問題是,當處理大量的追隨者列表時,你很快超過了速率限制,所以我正在尋找一種方法將ID塊分成100個批次並在Sys.sleep之後運行。 – 2012-02-08 19:32:29