r
  • twitter
  • text-mining
  • web-crawler
  • 2014-07-18 118 views 0 likes 
    0

    我特林讀取csv文件我的微博(我以前曾下載),和我有一些問題:我試圖從列表中的文本獲取文本從鳴叫

    sia.list <- searchTwitter('#singaporeair', n=10, since=NULL, until=NULL, cainfo="cacert.pem") 
    sia.df = twListToDF(sia.list) 
    write.csv(sia.df, file='C:/temp/siaTweets.csv', row.names=F) 
    

    和存在的問題是與下面的第三行:

    sia.df <- read.csv(file=paste(path,"siaTweets.csv",sep="")) 
    sia.list <- as.list(t(sia.df)) 
    sia_txt = sapply(sia.list, function(x) x$getText()) 
    

    控制檯輸出:

    > sia.list <- as.list(t(sia.df)) 
        > sia_txt = sapply(sia.list, function(x) x$getText()) 
        Error in x$getText : $ operator is invalid for atomic vectors 
    

    回答

    0

    x $ getText()在這裏沒有意義。因爲您正在使用sapply(),因此每個元素sia.list是傳遞給x的內容,並且這些元素沒有可以使用$運算符訪問的子元素。

    什麼是getText()?這不是基於r或twitteR軟件包中的功能。如果它是來自其他軟件包的功能,或許getText(x)是你想要的,但是如果不知道更多關於它的來源,很難說。

    1

    如果你想讀一個CSV文件中的文本,所有你需要做的是:sia_txt <- sia$text(文本是在文本存儲在列的名稱。)

    x$getText你用過在saaplymethod只可用於列表,這是因爲searchTwitter()的結果。因此,您無法將DF轉換回列表並使用getText。對於例如這樣做:

    xyz <- searchTwitter("#xyz", n = 100)

    str(xyz)

    你會看到的適用方法的列表。是這樣的:

    $ :Reference class 'status' [package "twitteR"] with 17 fields ..$ text : chr "RT @BET: \"Who's left to love the black woman?\" ~ WATCH last night's #BeingMaryJane here:\nhttp://t.co/xiUho1FVQi http://t.co/"| __truncated__ ..$ favorited : logi FALSE ..$ favoriteCount: num 0 ..$ replyToSN : chr(0) ..$ created : POSIXct[1:1], format: "2015-03-11 13:28:01" ..$ truncated : logi FALSE ..$ replyToSID : chr(0) ..$ id : chr "575649378062434304" ..$ replyToUID : chr(0) ..$ statusSource : chr "<a href=\"http://twitter.com\" rel=\"nofollow\">Twitter Web Client</a>" ..$ screenName : chr "kookie_kay" ..$ retweetCount : num 20 ..$ isRetweet : logi TRUE

    and 51 methods, of which 39 are possibly relevant: .. getCreated, getFavoriteCount, getFavorited, getId, getIsRetweet, getLatitude, getLongitude, getReplyToSID, .. getReplyToSN, getReplyToUID, getRetweetCount, getRetweeted, getRetweeters, getRetweets, getScreenName, .. getStatusSource, **getText**, getTruncated, getUrls, initialize

    通知的getText

    相關問題