Year Age.group Est.pop 
1 2015  0-4 7753 
2 2015  5-9 7233 
3 2015  10-14 6623 
4 2015  15-19 6982 
5 2015  20-24 8817 
6 2015  25-29 8674 
7 2015  30-34 7947 
8 2015  35-39 7166 
9 2015  40-44 6653 
10 2015  45-49 6011 
11 2015  50-54 5469 
12 2015  55-59 4623 
13 2015  60-64 3310 
14 2015  65-69 1896 
15 2015  70-74 1375 
16 2015  75-79 1162 
17 2015  80+ 1878 



vietnam2015 %>% 
    filter(Age.group != "5-9") %>% # Somehow this weird value creeped into the data frame, is therefor filtered out. 
    ggplot(aes(x = Age.group, y = Est.pop)) + 
    geom_col(colour = "black", 
      fill = "#FFEB3B") 

Histogram explained


你有看'geom_dotplot()'? – aku


是的,但我似乎無法找到正確數量的binwidth。我得到一個錯誤:'stat_bindot()使用bin = 30。用binwidth選擇更好的值.'還有'geom_dotplot'文檔說'...和點堆疊,每個點表示一個觀察值。 – Tdebeus





df2 = dcast(data = df, Year~Age.group, value.var = "Est.pop") 

df3 = do.call(rbind, lapply(2:NCOL(df2), function(i) 
data.frame(Age.group = names(df2)[i], Est.pop = seq(0, df2[,i], 200)))) 

ggplot(data = df3[df3$Age.group != "5-9",], 
    aes(x = factor(Age.group), y = Est.pop)) + 

感謝您的回答,但這並不是我想到的。也許有一種方法,我們可以爲每個單獨的'Age.group'繪製幾行粗點行....?我現在想着繞道而行,也許'圖書館(華夫餅)'包可以幫助我們。 – Tdebeus


我們可以使用geom_dotplot。正如你所提到的那樣,點圖通常用於小計數,但我們可以彙總數據。在下面的代碼中,我使用mutate(Est.pop = round(Est.pop, digits = -3)/1000)Est.pop四捨五入爲1000,然後除以1000.之後,我重複每個Age.group多少次我在Est.pop列中計算。最後,我用geom_dotplot來繪製數據。每個點代表1000人。 y軸是隱藏的,因爲我認爲這個可視化主要關注點號。

# Load package 

# Process the data 
dt2 <- dt %>% 
    mutate(Est.pop = round(Est.pop, digits = -3)/1000) %>% 
    split(f = .$Age.group) %>% 
    map_df(function(x) x[rep(row.names(x), x$Est.pop[1]), ]) 

# Plot the data 
ggplot(dt2, aes(x = Age.group)) + 
    geom_dotplot() + 
    scale_y_continuous(NULL, breaks = NULL) 

