我有下面的數據。我如何確定哪個作者的出版物數量最多?如何索引異常值?
我試試這個
(which(status$researchers==max(status$publications))
,但它似乎並沒有工作。
#PUBLICATIONS
researchers = c("Smith", "Johnson", "Williams", "Brown", "Jones", "Miller", "Davis", "García", "Rodriguez", "Wilson", "Martinez", "Anderson", "Taylor", "Thomas", "Hernandez", "Moore", "Martin", "Jackson", "Thompson", "White", "Lopez", "Lee", "Gonzalez", "Harris", "Clark", "Lewis", "Robinson", "Walker", "Perez", "Hall", "Young", "Allen", "Sanchez", "Wright", "King", "Scott", "Green", "Baker", "Adams", "Nelson", "Hill", "Ramirez", "Campbell", "Mitchell", "Roberts", "Carter", "Phillips", "Evans", "Turner", "Stapel", "Torres", "Parker", "Collins", "Edwards", "Stewart", "Flores", "Morris", "Nguyen", "Murphy", "Rivera", "Cook", "Rogers", "Morgan", "Peterson", "Cooper", "Reed", "Bailey", "Bell", "Gomez", "Kelly", "Howard", "Ward", "Cox", "Diaz", "Richardson", "Wood", "Watson", "Brooks", "Bennett", "Gray", "James", "Reyes", "Cruz", "Hughes", "Price", "Myers", "Long", "Foster ", "Sanders", "Ross", "Morales", "Powell", "Sullivan", "Russell", "Ortiz", "Jenkins", "Gutierrez", "Perry", "Butler", "Barnes", "Fisher", "De Jong", "Jansen", "De Vries", "vd Berg", "Van Dijk", "Bakker", "Janssen", "Visser", "Smit", "Meijer", "De Boer", "Mulder", "De Groot", "Bos", "Smeesters", "Vos", "Peters", "Hendriks", "Van Leeuwen", "Dekker", "Brouwer", "De Wit", "Dijkstra", "Smits", "De Graaf", "Van der Meer", "Muller", "Schmidt", "Schneider", "Fischer", "Meyer", "Weber", "Schulz", "Wagner", "Becker", "Hoffmann", "Wagemakers", "Molenaar", "Jansen", "White", "Bargh", "Dijksterhuis", "Poldermans", "Kanazawa", "Lynne", "Ling", "Vorst", "Borsboom", "Wicherts")
articles = data.frame(cbind(researchers, publications))
write.table(articles, file = "scientific status.txt", sep = " ")
status = read.table("scientific status.txt", header = TRUE, sep = "", quote = "\"'")
我不認爲你如何創建數據,甚至更少的'{寫,讀}。表「步驟是相關的在這裏。如果你給出了你的數據樣本,那將會更有用,請參考http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example – flodel
好吧,我認爲創建能夠創建數據會很有用。 – mats
但是「status」的內容是什麼?除非它們是整數,否則你不可能得到任何匹配。你的'研究員'矢量沒有數字,所以'max'將用這些字符串做有趣的事情。 –