我有一個Excel工作表,其中包含美國每個縣的每個行業的就業編號。根據功能創建一個新列
它看起來像這樣:
County Industry Employees
a 1 49
a 2 1
b 1 4
b 2 19
...
我希望在每個縣,計算Herfindahl-Hirschman index(HHI)就業。我使用R. 鑑於一些數字,計算HHI很容易:
hhi <- function(x) {
# calculate sum
total <- sum(x)
# calculate share
share <- x*100/total
# add
return(sum(share^2))
}
因此,舉例來說,縣1具有9608一個HHI(= 98^2 + 2^2),縣2具有HHI爲7127.
但是我怎樣才能創建一個新的列與該縣的HHI?
如何忽略NA使用第一種方法值? – wwl
您可以爲sum函數指定na.rm = T。 – Psidom