我環顧了很多,但無法找出這一個。我有一個數據框有相同的日期多行(2014-05-13日期有15行),那麼我有一個數據幀2,每個日期只有一個值。我怎樣才能合併這兩個並重復所有重複日期行數據幀2的值?合併兩個不同長度的數據幀並根據日期重複
使用:
master = merge(returns,count_msg, by = "date", all=TRUE)
合併的第二數據幀,但引入了一個字計數是NA
新行。我的最終目標是對字數與日常收益進行迴歸分析。
我環顧了很多,但無法找出這一個。我有一個數據框有相同的日期多行(2014-05-13日期有15行),那麼我有一個數據幀2,每個日期只有一個值。我怎樣才能合併這兩個並重復所有重複日期行數據幀2的值?合併兩個不同長度的數據幀並根據日期重複
使用:
master = merge(returns,count_msg, by = "date", all=TRUE)
合併的第二數據幀,但引入了一個字計數是NA
新行。我的最終目標是對字數與日常收益進行迴歸分析。
您可以使用dplyr
加入數據框。
library(dplyr)
master <- count %>% left_join(returns, by = "date")
我在這裏猜測你不希望日期的回報,當你沒有任何字數。
感謝您的回覆,所以我只在count_msg表中找到的日期範圍加載了返回數據,所以我只需要重複用戶發佈的每條消息的返回值,即用戶在同一日期發佈了十條消息,以便重複當天返回十次;當我放入你的代碼時,它給了我錯誤:不能加入一個Date對象和一個不是Date對象的對象。我從來沒有使用過日期對象,現在這個類是簡單的數據框和數字列。 – user2420956
是的,兩個「日期」欄需要是相同的類型。嘗試在連接之前設置'返回$ date < - as.Date(返回$ date)'和'count $ date < - as.Date(count $ date)'。我猜這兩個日期列中的一個已經是一個日期,另一個是一個字符。 – Sraffa
@ user2420956這類問題是您不應發佈數據圖像的原因。請按照[這裏](http://stackoverflow.com/a/5963610/3817004)的說明發布'dput(...)'。 – Uwe
嘗試使用na.locf(「列名」)替換NA值 –
請勿將鏈接粘貼到數據圖像。花時間將數據輸入到網站中,否則人們通常不會查看它。 – manotheshark
請閱讀[如何讓您的示例可重現](http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example#5963610)。 – alistaire