我剛開始研究一個擁有500萬觀測值和大量變量的海量數據集。爲了更快地處理這個問題,我只想選擇一些感興趣的變量,然後放棄其他的變量。在多個變量塊上使用Stata的keep命令
與keep
,我可以選擇的變量塊,很簡單:
keep varx1-x5
不過,我想這些變量是不是爲了在數據集:
varx1 varx2 varx3 varz1 varz2 vary1 vary2 vary3
在哪裏我不t想要varz
變量。我只想要varx
和vary
的區塊。
所以。我不是在循環很好,但我想這一點:
foreach varname of varlist varx1-varx3 vary1-vary3 {
keep `varname'
}
這是不行的,因爲它keep
唯一varx1
,然後嘗試keep
別人,和錯誤,因爲他們剛剛去過drop
PED。
如何告訴keep
選擇多個變量塊?
在這種情況下'*'的陳述意義不正確。對於正則表達式來說很好,但這裏只是表示所有以'varx'開頭的變量都是後綴。例如:'varx1','varx2','varxwhatever'。 'help varlist'的引用是「匹配一個或多個字符」。 (原始的海報希望保留'varx *'和'vary *',而不是'varz *'。) – 2014-11-06 17:03:33
當然。多麼愚蠢,我沒有想到這一點。謝謝! – emilBeBri 2014-11-07 08:29:48