我正在處理一個大約700 000行的data.frame。它包含來自twitter的statusupdates的id和相應的用戶名。我只想知道那裏有多少不同的用戶以及他們推送了多少次。所以我認爲這是一個使用表格的非常簡單的任務。但知道我注意到我得到了不同的結果。R頻率表包含0
最近我做了它的列轉換爲字符這樣
>freqs <- as.data.frame(table(as.character(w_dup$from_user))
>nrow(freqs)
[1] 239678
2個月前我做了這樣的
>freqs <- as.data.frame(table(w_dup$from_user)
>nrow(freqs)
[1] 253594
我注意到,這樣的數據幀中包含有一個頻率的用戶名0.怎麼可能?如果用戶名在數據集中,則必須至少出現一次。
?表沒有幫助我。我也無法在較小的數據集上重現此問題。
我做錯了什麼。還是我誤解了表格的使用?
我在我的問題中做了一個類似的錯誤,但我想在我的表中保留[零頻率計數](http://stackoverflow.com/q/13705060/610108)。 'table'產生一個應急表,'tabular'產生一個頻率表。 – ThomasH