dummy-variable

0熱度

1回答

我在Stata中設置了不平衡面板數據集。從1993年到2013年的觀察。我有一個名爲bankrupcty year的變量，表示每家公司破產的年份。問題在於，在每家公司破產之前，我的Stata文件缺失達2年之久。也就是說，一家公司在2003年破產，該公司最後一次觀察是在2002年或2001年。然而，我想創建一個虛擬變量，因爲公司破產時，但由於我錯過了那一年，我無法執行命令： gen bankrupt

2熱度

1回答

從我的數據框中創建一個虛擬變量矩陣;使用'NA`作爲缺失值

我有一個基於不同年份的數據，重複了幾次。我希望我的輸出具有等於年數的列，每列列一年。現在，目的是分別爲每一年創建虛擬。例如，每當2000年的主要數據中存在非NA觀察值時，2000年的輸出列必須具有值「1」，否則爲「0」。而且，NA必須保持NA。請參考下面的輸入數據的小樣本： df: 2000 NA 2001 NA 2002 -1.3 2000 1.1 2001 0 2002 NA 2

3熱度

2回答

Dask + Pandas：返回一系列條件假人

在Pandas中，如果我想創建一列有條件的假人（如果變量等於一個字符串，則爲1，如果不是，則爲0），那麼我的轉到熊貓是： data["ebt_dummy"] = np.where((data["paymenttypeid"]=='ebt'), 1, 0) 天真地在dask數據幀中嘗試此操作會引發錯誤。繼爲方向的map_partitions文檔中還拋出一個錯誤：什麼是一個很好的方式，還是

0熱度

1回答

SAS：

組內按組編碼爲一個變量的值的僞變量I具有CASE_ID（x和y和z），一組多個日期（包括重複日期）爲每個CASE_ID中的數據集，和可變VAR。我想的基團，由此，如果VAR =在某些具體的日期，則DUMMYVAR = 1對應於CASE_ID所有觀察「C」爲CASE_ID X X上與該日期內創建由組虛擬變量DUMMYVAR。我相信，一個經典2XDOW是這裏的關鍵，但這是利用SAS，並且無法獲得這

1熱度

1回答

在兩個合併期間爲兩個條件之一創建虛擬對象

我正在使用Stata。我是從TUS（即時間使用調查）獲得的描述性統計之後：爲全職工作者工作的每日總時間（因爲這些數據來自盧森堡，工作日至少8小時爲全職工作者）。因此，我研究了TUS的子樣本，那裏只有那些宣佈被僱用的人。在此數據集的子樣本中，每人有兩個觀察值，一個在週末和一個在周（即它是一種短面板數據集）。因爲我感興趣的只是那些誰全職工作的人，我想衡量在這兩天的總工作時間兩種類型的個體：個

0熱度

1回答

如何查找其虛擬變量從1變爲0（而不是反之亦然）在df中的觀測值

我有一個由n個個體組成的調查;每個人在調查中都會出現一次以上（小組）。我有一個可變的鋼筆，如果個人投資於補充性養老金形式，這是一個虛擬價值爲1的虛擬鋼筆。例如： df <- data.frame(year=c(2002,2002,2004,2004,2006,2008), id=c(1,2,1,2,3,3), y.b=c(1950,1943,1950,1943,1966,1966), sex=c(

-3熱度

1回答

虛擬編碼模型矩陣的R算法是什麼？

我注意到，當使用虛擬編碼來擬合我的線性模型時，R在形成模型矩陣時排除了某些參數。什麼是R算法來做到這一點？

0熱度

1回答

R：添加虛擬變量列到xts時間序列對象

我有一個xts時間序列對象，由2015年的分鐘盤點交易數據組成。我想添加一個虛擬變量，將1表示爲事件日或0作爲事件日一個非凡的一天。由於虛擬變量本質上不是時間序列，因此我可以將其添加到我的交易數據中嗎？我該如何構建虛擬列？它如何被添加到現有的xts？新的R，所以請儘可能在您的答案中具體。謝謝！

0熱度

1回答

更改默認的二進制標記

我用model.matrix()方法R生成虛擬變量： dd <- data.frame(a = gl(2,2)) model.matrix(~ a - 1,dd) 而不是0和1個輸出標籤，我們需要在model.matrix()設置，使輸出的標籤是什麼參數是-1和1？

0熱度

1回答

無法將數據幀轉換爲r中的設計矩陣

我幾天前開始使用R，並且確實可以使用一些幫助：D 我目前有一個包含200個觀察值和12個變量的數據框（它們表示點擊，所以他們被命名爲c1-c12）。背景：用戶在字段上單擊（最多12次）。這些字段下令6行和4列和所述用戶的點擊次數被記錄爲電話號碼。： [,1] [,2] [,3] [,4] [1,] "11" "21" "31" "41" [2,] "12" "22" "32" "42"