我的數據集包括兩個主要變量X
和Y
。在Stata中使用虛擬變量和foreach生成變量的手段
- 變量
X
代表具有不同品牌的多個計算機項目的不同代碼(例如001X01,001X02等)。 - 變量
Y
表示在商店中爲變量X
(例如,對於001X01,15 = 15%)的每個代碼徵收的稅。
我已經創建了使用虛擬變量這些計算機項類別(例如HD
虛擬變量爲硬盤驅動器,取1值時可變X
表示HD等)。我有一個超過40個變量的列表(其中兩個代表X
和Y
,其餘的是我爲計算機項目創建的不同類別的一組虛擬變量)。
我想在Stata中使用循環顯示所有這些類別的平均值,但我不確定如何執行此操作。
例如代碼:
mean Y if HD == 1
Mean estimation Number of obs = 5
--------------------------------------------------------------
| Mean Std. Err. [95% Conf. Interval]
-------------+------------------------------------------------
Tax | 7.1 2.537716 1.154172 15.24583
讓我對代表硬盤類別的平均稅。我如何在Stata中使用循環來自動顯示爲每個類別收取的所有平均稅收?我會手工做到這一點,但沒有問題,但我想重複這個過程多年,所以我想每年使用一個循環來獲得這個輸出。
我的目標是創建一個單獨的Excel文件,其中包含我創建的每個計算機類別(總計38個)以及每個類別的平均稅額。
非常感謝您的回覆。我的數據並沒有真正的CATEG變量,只有CODE&TAX,代碼描述了一個項目(例如HD),但每個代碼都是唯一的,即使它們屬於同一類別(所以我有50個不同的代碼 - 所有代碼適用於硬盤驅動器)。我創建了一個虛擬變量來「分類」這些項目。另外,我不會使用所有的代碼,其中一些數據包括我不感興趣的計算機部分。 – user3339434
Collapse絕對做我正在尋找的東西,我只需做一些小的修改(例如根據虛擬變量創建一個類別變量)。感謝Roberto Ferrer.I仍然樂於學習如何在這種情況下使用循環,任何幫助將不勝感激。 – user3339434
當你的分類變量'X'中已經有相同的信息(爲什麼你認爲你需要創建一個不明確)時,在這裏創建指標(你說虛擬變量)沒有什麼好處。正如@Roberto Ferrer指出的那樣,這裏不需要循環,但可用的循環技術顯着記錄在例如http://www.stata.com/support/faqs/data-management/try-all-values-with-foreach/index.html –