R新手。我正在嘗試創建一個包含水平數據的共生矩陣。我想知道哪些元素在行中共同出現'TRUE'。R共生矩陣水平數據
每一行代表一篇文章。每篇文章都有很多標記存在或缺乏元素的真/假變量。有100個元素,縮寫在這裏,超過10K的文章。所以一個10,000 x 101的數據幀。
dat <- read.table(text='"article" "element1" "element2" "element3" "element4"
1 "a house a home" "TRUE" "TRUE" "FALSE" "FALSE"
2 "cabin in the woods" "TRUE" "TRUE" "FALSE" "FALSE"
3 "motel is a hotel" "TRUE" "FALSE" "TRUE" "FALSE"', header=TRUE)
我想在這個共發生問題(Creating co-occurrence matrix),但它似乎是因爲數據是不同的方式組織,即接近不會工作。
如果100個元素x 100個元素,則會有幫助的是矩陣。任何人都有建議?