這個問題只是爲了理解爲什麼會發生這種情況。合併函數生成重複項
我合併兩個數據庫:
bot.rep.geo <- merge(x = bot.rep, y = geo.2016, by = "cod.geo", all.x = TRUE)
原來的數據庫有以下方面:bot.rep
有1634451層的意見,geo.2016
有1393
使用all.x = TRUE
合併後,新的數據庫1727681浮現,而不是與bot.rep
相同的尺寸。
爲什麼會發生這種情況?
經過快速審查,我意識到它正在創建一些重複項,但我不明白原因,如果我在使用merge
函數時做錯了什麼。
通過選擇'all.x = TRUE',您在SQL中執行了等同於'LEFT JOIN'的操作。這並不意味着'bot.rep'中的給定行只會出現一次。相反,它會在'cod.geo'中出現一次,並且'bot.rep'中的每一行保證出現,即使與任何東西都不匹配。 –
向我們展示一些示例數據,這將很清楚。 –
謝謝@TimBiegeleisen的澄清。有什麼辦法可以防止這種情況發生,或者只是需要在事後刪除重複的內容? –