2016-08-15 92 views
0

假設您有一個非常大的csv格式的輸入文件。並且您想知道每列中出現的不同值。你會怎麼做?從列中獲取不同的值R

ex。

column1 column2 column3 column4 
---------------------------------------- 
value11 value12 value13 value14 
value21 value22 value23 value24 
... 
valueN1 valueN2 valueN3 valueN4 

所以我想我的輸出是這樣的:

column1 has these values: value11, value21, ...valueN1。但我不需要看到具有相同價值的再次發生。我需要這個只是想知道我的數據是關於什麼的。

回答

2

dat是你的數據幀在csv文件看完之後,你可以做

ulst <- lapply(dat, unique) 

如果進一步想知道每個列的唯一值的數量,做

k <- lengths(ulst) 
+1

或者使用'dplyr'即。 'dat%>%summarise_each(funs(n_distinct))' – akrun