我正在處理一些美國政府的數據,這些數據中有很長的城市和郵政編碼列表。 經過一番努力,數據格式如下。從數據框中刪除特定的行
dat1 = data.frame(keyword=c("Bremen", "Brent", "Centreville, AL", "Chelsea, AL", "Bailytown, Alabama", "Calera, Alabama",
"54023", "54024"), tag=c(rep("AlabamCity",2), rep("AlabamaCityST",2), rep("AlabamaCityState",2), rep("AlabamaZipCode",2)))
dat1
但是,有某些關鍵字不能正常工作。所以在下面的例子中,有兩個'郵政編碼',其中 被標記爲'AlabamaCity'和'AlabamaCityState'。由於某些原因,政府提供的原始數據集有幾個郵政編碼 ,這些郵政編碼與其他郵政編碼沒有正確分組。
dat2 = data.frame(keyword=c("Bremen", "Brent", "50143", "Chelsea, AL", "Bailytown, Alabama", "52348",
"54023", "54024"), tag=c(rep("AlabamCity",2), rep("AlabamaCityST",2), rep("AlabamaCityState",2), rep("AlabamaZipCode",2)))
dat2
我想知道我怎麼會通過關鍵詞的整個列表進行迭代,並刪除所有與數字值的行(他們acctually保存字符 值)不具有「AlabamaZipCode」標籤。所以之前的數據應該看起來像。
dat3 = data.frame(keyword=c("Bremen", "Brent", "Chelsea, AL", "Bailytown, Alabama", "54023", "54024"),
tag=c(rep("AlabamCity",2), rep("AlabamaCityST",1), rep("AlabamaCityState",1), rep("AlabamaZipCode",2)))
dat3
challange似乎是有某些我想保留的數值和我想刪除的其他數值。 任何人都可以幫忙。