想象一下,您有一個包含2個變量的數據框 - 名稱&年齡。名稱是類別因素和年齡號碼。現在想象一下,現在這個數據框中有成千上萬的人。你如何:R中計數和直方圖圖示
產生一個表:名稱| COUNT(NAME)爲每個名稱唯一嗎?
生成一個直方圖,您可以在該直方圖中更改要顯示在直方圖中的最少數量的 。
對於第2部分,我希望能夠測試不同的最小頻率值並查看直方圖是如何出來的。還是有更好的方法務實地確定每個名稱輸入直方圖的最小數量?
謝謝!
編輯:下面是表會是什麼樣子在RDBS:
NAME | COUNT(NAME)
John | 10
Bill | 24
Jane | 12
Tony | 50
伊曼紐爾| 1 ...
我想要做的是創建一個函數來繪製直方圖,其中我可以更改一個設置要繪製的最小頻率的值。更有意義?
你嘗試過什麼已經,什麼也沒有工作,以及在什麼地方你想幫助嗎?哦,你有我們可以使用的一些數據嗎?請參閱http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example獲得一些幫助。 –
所以我剛剛找到了'table()'函數,當你傳遞它時,一個名稱數組將自動爲你提供計數。我應該在那裏很好。對於直方圖,我使用'plot(df.counts $ NAME [which(df.counts> 10)]);'但這不起作用。 –
從你提供的內容來看,沒有辦法知道你的'df.counts'是什麼樣的,也不知道'NAME'的外觀。假設你的初始data.frame是'd',並且名字在'name'元素中,試試'plot(as.table(table(d $ name)[table(d $ name)> 10]))' – jbaums