0
我使用R來分析來自多家醫院的有關抗生素使用的數據。從一個載體中整理數據
根據整齊的數據原則,我已經將這些數據導入到一個框架中。
>head(data)
date antibiotic usage hospital
1 2006-01-01 amikacin 0.000000 hospital1
2 2006-02-01 amikacin 0.000000 hospital1
3 2006-03-01 amikacin 0.000000 hospital1
4 2006-04-01 amikacin 0.000000 hospital1
5 2006-05-01 amikacin 0.937119 hospital1
6 2006-06-01 amikacin 1.002961 hospital1
(該數據集是月度數據×5家醫院×40種抗生素)
我想要做的第一件事就是聚集到抗生素類。
> head(distinct(select(data, antibiotic)))
antibiotic
1 amikacin
2 amoxicillin-clavulanate
3 amoxycillin
4 ampicillin
5 azithromycin
6 benzylpenicillin
7 cefalotin
8 cefazolin
> penicillins <- c("amoxicillin-clavulanate", "amoxycillin", "ampicillin", "benzylpenicillin")
> ceph1 <- c("cefalotin", "cefazolin")
我會想做什麼,然後根據這些抗生素類矢量子集數據:
filter(data, antibiotic =(any one of the values in the vector "penicillins")
感謝thelatemail您指出要做到這一點的方法是:
d <- filter(data, antibiotic %in% penicillins)
我想要做的數據分析的方式有很多種:
鍵分析(和ggplot輸出)爲:
X =日期
Y =由(藥物分層抗生素(S)的使用|類),醫院過濾
我不清楚現在是如何聚合這種事情的數據。
例子:
我想分析區內所有醫院使用類「ceph1」,致使(道歉 - 我知道這是不正確的代碼)
x y
Jan-2006 for all in hospitals(usage of cephazolin + usage of cephalotin)
Feb-2006 for all in hospitals(usage of cephazolin + usage of cephalotin)
etc
而且,從長遠來看,能夠將論據傳遞給一個功能,使我能夠選擇哪些醫院和哪種抗生素或哪類抗生素。
再次感謝 - 我知道這比原始問題複雜得多!
'%in%'可能是您正在尋找'%penicillins'的抗生素%的例子。 – thelatemail
的確如此 - 這太棒了,謝謝! – Trent