2012-05-15 17 views
-2

編輯:R:正確使用表()的

因爲我現在還在用這個struggleing,這裏的附加信息:

矩陣有列的SessionID,用戶名,查詢,[一些基於時間參數],長度和字符長度

我想要得到一個頻率表的查詢和長度,即查詢,矩陣查詢頻率,長度。

table(matrix$query,matrix$length) 

產生,而不顯示實際queryname和一大堆列

的表如何使用表()有權得到我想要的表?

+1

不那麼明顯(對我)說你有內存問題。請發佈一個小的可重複樣本,以便我們可以看到「查詢」數據具有哪些值。解決方案可能很簡單,只需將查詢列定義爲一個因素,然後查看每個級別的數量,然後創建'newmatrix < - oldmatrix [oldmatrix $ query%in%X.frequent,]'(pseudocode),其中'X .frequent'是頂級X級別的矢量。 –

回答

2

我想你可以使用table功能:它是相當快的,並給每個查詢的頻率(你可以阿爾索斯對它進行排序),例如:

sort(table(mat[,"query"])) 
+1

使用'tabulate()'如果速度是最重要的,並且結果不包含負值 – Chase

+0

已更新我的帖子 – Rickyfox