dummy-variable

    0熱度

    1回答

    我在Stata中設置了不平衡面板數據集。從1993年到2013年的觀察。我有一個名爲bankrupcty year的變量,表示每家公司破產的年份。問題在於,在每家公司破產之前,我的Stata文件缺失達2年之久。也就是說,一家公司在2003年破產,該公司最後一次觀察是在2002年或2001年。然而,我想創建一個虛擬變量,因爲公司破產時,但由於我錯過了那一年,我無法執行命令: gen bankrupt

    2熱度

    1回答

    我有一個基於不同年份的數據,重複了幾次。我希望我的輸出具有等於年數的列,每列列一年。現在,目的是分別爲每一年創建虛擬。例如,每當2000年的主要數據中存在非NA觀察值時,2000年的輸出列必須具有值「1」,否則爲「0」。而且,NA必須保持NA。請參考下面的輸入數據的小樣本: df: 2000 NA 2001 NA 2002 -1.3 2000 1.1 2001 0 2002 NA 2

    3熱度

    2回答

    在Pandas中,如果我想創建一列有條件的假人(如果變量等於一個字符串,則爲1,如果不是,則爲0),那麼我的轉到熊貓是: data["ebt_dummy"] = np.where((data["paymenttypeid"]=='ebt'), 1, 0) 天真地在dask數據幀中嘗試此操作會引發錯誤。繼爲方向的map_partitions文檔中還拋出一個錯誤: ​​ 什麼是一個很好的方式,還是

    0熱度

    1回答

    組 內按組編碼爲一個變量的值的僞變量I具有CASE_ID(x和y和z),一組多個日期(包括重複日期)爲每個CASE_ID中的數據集,和可變VAR。我想的基團,由此,如果VAR =在某些具體的日期,則DUMMYVAR = 1對應於CASE_ID所有觀察「C」爲CASE_ID X X上與該日期內創建由組虛擬變量DUMMYVAR。 我相信,一個經典2XDOW是這裏的關鍵,但這是利用SAS,並且無法獲得這

    1熱度

    1回答

    我正在使用Stata。 我是從TUS(即時間使用調查)獲得的描述性統計之後:爲全職工作者工作的每日總時間(因爲這些數據來自盧森堡,工作日至少8小時爲全職工作者)。 因此,我研究了TUS的子樣本,那裏只有那些宣佈被僱用的人。 在此數據集的子樣本中,每人有兩個觀察值,一個在週末和一個在周(即它是一種短面板數據集)。 因爲我感興趣的只是那些誰全職工作的人,我想衡量在這兩天的總工作時間兩種類型的個體: 個

    0熱度

    1回答

    我有一個由n個個體組成的調查;每個人在調查中都會出現一次以上(小組)。我有一個可變的鋼筆,如果個人投資於補充性養老金形式,這是一個虛擬價值爲1的虛擬鋼筆。例如: df <- data.frame(year=c(2002,2002,2004,2004,2006,2008), id=c(1,2,1,2,3,3), y.b=c(1950,1943,1950,1943,1966,1966), sex=c(

    -3熱度

    1回答

    我注意到,當使用虛擬編碼來擬合我的線性模型時,R在形成模型矩陣時排除了某些參數。什麼是R算法來做到這一點?

    0熱度

    1回答

    我有一個xts時間序列對象,由2015年的分鐘盤點交易數據組成。我想添加一個虛擬變量,將1表示爲事件日或0作爲事件日一個非凡的一天。 由於虛擬變量本質上不是時間序列,因此我可以將其添加到我的交易數據中嗎? 我該如何構建虛擬列? 它如何被添加到現有的xts? 新的R,所以請儘可能在您的答案中具體。謝謝!

    0熱度

    1回答

    我用model.matrix()方法R生成虛擬變量: dd <- data.frame(a = gl(2,2)) model.matrix(~ a - 1,dd) 而不是0和1個輸出標籤,我們需要在model.matrix()設置,使輸出的標籤是什麼參數是-1和1?

    0熱度

    1回答

    我幾天前開始使用R,並且確實可以使用一些幫助:D 我目前有一個包含200個觀察值和12個變量的數據框(它們表示點擊,所以他們被命名爲c1-c12)。 背景: 用戶在字段上單擊(最多12次)。這些字段下令6行和4列和所述用戶的點擊次數被記錄爲電話號碼。: [,1] [,2] [,3] [,4] [1,] "11" "21" "31" "41" [2,] "12" "22" "32" "42"