3
我有一組數據(10列,1000行),它們由一個或多個這些行可共享的ID號索引。舉一個小例子來說明我的觀點,認爲這是桌子:使用相同密鑰索引中的值填充空白字段
ID Name Location
5014 John
5014 Kate California
5014 Jim
5014 Ryan California
5018 Pete
5018 Pat Indiana
5019 Jeff Arizona
5020 Chris Kentucky
5020 Mike
5021 Will Indiana
我需要的所有條目有在位置字段中的東西,我有一個時間試圖做一個地獄。
注意事項:
- 每一個唯一的ID號碼至少有一排用填充位置字段。
- 如果兩行具有相同的ID號,則它們具有相同的位置。
- 兩個不同的ID號可以有相同的位置。
- 身份證號碼不一定是連續的,也不一定是完全數字的。它們的排列對我來說並不重要,因爲任何相關的行都有相同的ID號。
解決方案的任何想法?我目前使用R與data.table
包,但我相對較新。
工程就像一個魅力,謝謝!你介意點解釋一下嗎?在列操作之後但在「by = ID」之前有空白的「,,」是什麼語法推理?爲什麼[]之後?對不起,我是新手。試圖瞭解解決方案背後的原因 – 2015-03-25 12:35:45
@JeffY添加了一些解釋。 '[]'不是必需的。這只是將輸出打印到控制檯。 – akrun 2015-03-25 12:41:18
':= setdiff(Location,'')'或':= setdiff(Location,'')[1L]'是另一種選擇。 – Frank 2015-03-25 13:13:54