讓我們假設我有一個誰看了電影的人一個數據表,像複雜data.table操作
library(data.table)
DT = fread("
User, Movie
Alice , Fight Club
Alice, The Godfather
Bob, Titanic
Charlotte, The Godfather")
我要計算,每對電影的,誰看了都的人數和誰看了至少一個人的數量,即
Movie1 Movie2 WatchedOne WatchedBoth
Fight Club The Godfather 2 1
The Godfather Titanic 3 0
Fight Club Titanic 2 0
我有幾百萬行,我需要一個極快的data.table功能:-)
感謝您的幫助!
嘗試製作一個容易重現的例子(例如,可以複製粘貼)。請參閱https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example/28481250#28481250 – Frank
好的我做到了,謝謝 – mac
您的數據集包含多少部不同的電影? – Uwe