塔塔：找到跨越變量重複不考慮遺漏值

-1

假設我有2個觀測和7個變量（其中表示遺漏值）數據集：塔塔：找到跨越變量重複不考慮遺漏值

crop1 crop2 crop3 crop4 nw1 nw2 nw3 
    3  7  2  .  3  7  . 
    5  9  .  .  5  .  .

現在我想找到的重複數Group1（crop1-crop4）變量和Group2（nw1-nw3）變量之間的值，通過生成一個名爲的新變量排除缺失的值。重複項。然後將新的數據集將是以下：

crop1 crop2 crop3 crop4 nw1 nw2 nw3 duplicates 
    3  7  2  .  3  7  .  2 
    5  9  .  .  5  .  .  1

因爲2的值（3,7）被發現重複用於第一觀察，和1倍的值（5）被發現，複製給所述第二觀察。

我可以用什麼樣的命令來獲取新的數據集？

來源

2015-10-13 Chen

你試過什麼代碼？ –

也許是這樣的：make a row-number column，'gen id = _n'; '重塑長時間作業，我（id）j（組）';然後'複製標籤ID組，gen（d）' – Frank

我不明白你的比較變量的規則，例如你有4 crop變量和3 nw變量。

這是您的問題的開始。如果你的規則不同，請詳細解釋。

我忽略crop4和每一個比較，其中變量用相同數字後綴名稱相同，但他們可能不會缺少算作重複。

clear 
input crop1 crop2 crop3 crop4 nw1 nw2 nw3 
    3  7  2  .  3  7  . 
    5  9  .  .  5  .  . 
end 

gen duplicates = 0 

forval j = 1/3 { 
    replace duplicates = duplicates + ((crop`j' == nw`j') & !missing(crop`j', nw`j')) 
} 

list 

    +------------------------------------------------------------+ 
    | crop1 crop2 crop3 crop4 nw1 nw2 nw3 duplic~s | 
    |------------------------------------------------------------| 
    1. |  3  7  2  .  3  7  .   2 | 
    2. |  5  9  .  .  5  .  .   1 | 
    +------------------------------------------------------------+

來源

2015-10-13 19:27:36

非常感謝！ @尼克考克斯！這正是我正在尋找的。 – Chen

塔塔：找到跨越變量重複不考慮遺漏值

回答

相關問題