1
我正在處理一個包含大約200行的數據框,我想刪除重複的行,將「分鐘」列中的值加在一起。我對R相當陌生,而且我還沒有找到辦法做到這一點。它涉及到應用正則表達式嗎?我真的很感激任何解決方案!如何基於R中的字符串匹配來聚合數據框中的行? - 正則表達式
數據幀我有看起來像這樣:
df <- data.frame(name = c("Adam Tucker", "AdamTucker", "[email protected]", "adamtucker", "James Mirra", "JamesTMirra", "Sebastian F"), minutes = c(10, 3, 15, 2, 5, 1, 10))
name minutes
Adam Tucker 10
AdamTucker 3
[email protected] 15
adamtucker 2
James Mirra 5
JamesTMirra 1
Sebastian F 10
我期待的結果是這樣的:
name minutes
Adam Tucker 30
James Mirra 6
Sebastian F 10
提前感謝!
自動識別像「AdamTucker」和「[email protected]」這樣的東西屬於同一個人並不是最簡單的事情。你有任何其他信息可以用來識別這些人嗎?否則可能需要一些手動清潔。 – Marius
不幸的是,我沒有任何其他信息。我猜測一個程序化的解決方案是不夠的 - 特別是對於那種情況 - 但是因爲我只是一個初學者,所以我想問問問題以防萬一。順便說一下,你會如何手動解決這個例子?謝謝! – Claudia
我會手動編輯數據(在原始的csv文件或其他內容中),添加一個新的列'cleaner_name',在那裏我以標準格式爲每行寫出名稱。之後,你可以自動完成聚合。 – Marius