我試圖用inner_join
合併兩個data.frames。我面臨的問題是合併結果只包含其中一個data.frames中的變量。爲什麼結果在`inner_join`之後包含不完整的變量?
我期望看到兩個數據框以不匹配的觀測值被丟棄並且這兩個變量仍然包含的方式合併。本例中的兩個數據幀分別命名爲cpds
和gtd
。
我敢肯定,我有兩個唯一標識符(在我的情況,state
& year
)這兩個變量名是在這兩個數據幀中的相同。雖然結果的確降低了所有無與倫比的觀察結果;但是,它只包含其中一個數據框中的變量。
這裏是我的代碼:
library(dplyr)
terdemo <- inner_join(cpds,gtd)
然後[R響應以下消息,包括警告之一。
Joining, by = c("country", "year")
Warning message:
In inner_join_impl(x, y, by$x, by$y, suffix$x, suffix$y) :
joining character vector and factor, coercing into character vector
任何人都可以解釋爲什麼這個警告信息被觸發?
注意:我使用RStudio版本1.0.136和mac OS Sierra版本10.12.3。相關包是dplyr
。
這兩個數據幀的名稱是什麼? –
@TimBiegeleisen,這兩個數據框是:全球恐怖主義數據集和比較政治數據集。 –