patsy

1熱度

1回答

我給了一個沒有響應變量的測試集。我已經建立了模型並需要預測測試集中的響應變量。我在格式化測試設計矩陣時遇到問題，因此它會兼容。我正在使用patsy庫構造矩陣。我想要做這樣的事情，除了下面的代碼不起作用： X = dmatrices('Response ~ var1 + var2', test, return_type = 'dataframe') 什麼是正確的做法？感謝

1熱度

1回答

構建設計矩陣python

假設我有一個RxC contingency table。這意味着有R行和C列。我想要一個尺寸爲RC×（R + C - 2）的矩陣X，它包含行的R-1「主效應」和列的C-1「主效應」。例如，如果你具有R = C = 2（R = [0，1]，C = [0，1]）和唯一的主效應，有各種方法來參數設計矩陣（X），但低於是一種方法： 1 0 0 1 1 0 0 0 注意，這是4×2 = RC X

0熱度

2回答

創建使用大熊貓或statsmodel爲兩列

我有這樣一個數據幀的交互虛擬變量： Index ID Industry years_spend asset 6646 892 4 4 144.977037 2347 315 10 8 137.749138 7342 985 1 5 104.310217 137 18 5 5 156.593396 2840 381 11 2 229.538828 6

0熱度

1回答

patsy中未修改的列名索引

我正在使用patsy爲迴歸準備分類數據，並且想要將列名映射到其DesignMatrix中的索引。我已嘗試使用DesignInfo對象的column_name_indexes屬性，但列名已被修改以反映編碼。實施例使用從docs數據： >>> from patsy import demo_data, dmatrix >>> data = demo_data("a", nlevels=3) >>>

-1熱度

2回答

通過創造條件在Python與大熊貓分類變量或statsmodels

我想創建從我的數據分類變量用這種方法： cat.var condition 1 x > 10 2 x == 10 3 x < 10 我嘗試使用從patsyC() method，但它不工作，我知道在Stata我有以下使用的代碼，但搜索後，我沒有找到任何清潔方式pyhton做到這一點： generate mpg3 = . (74 missing values generate

1熱度

1回答

python邏輯迴歸 - patsy設計矩陣和分類數據

python和機器學習頗爲新穎。我想建立一個邏輯迴歸模型。我曾在R工作獲得lambda，並使用交叉驗證來找到最好的模型，現在將它移入python。在這裏，我創建了一個設計矩陣，使其變得稀疏。然後運行邏輯迴歸。它似乎在工作。我的問題是，因爲我已經說過我的術語item_number是一個類如何知道哪個變成了虛擬變量？我怎麼知道哪個係數與每個類別名稱一致？ from patsy import dm

3熱度

2回答

如何獲取statsmodels/patsy公式所依賴的列？

假設我有一個pandas數據幀： df = pd.DataFrame({'x1': [0, 1, 2, 3, 4], 'x2': [10, 9, 8, 7, 6], 'x3': [.1, .1, .2, 4, 8], 'y': [17, 18, 19, 20, 21]}) 現在我適合使用公式（使用patsy引擎蓋下）一個statsmodel

17熱度

1回答

如何堅持patsy DesignInfo？

我工作的一個應用程序，它是一種「預測模型作爲一種服務」，結構如下：火車模型離線定期上傳模型參數的「預測服務器「預測服務器需要輸入一個單一的觀察，並輸出預測我試圖使用懦夫，但是遇到了以下問題：當一個預測進來，我怎麼轉換它正確的形狀，使它看起來像是一排訓練數據？的帕齊文檔提供了一個例子，當從訓練數據的DesignInfo可用存儲：http://patsy.readthedocs.io/en/

1熱度

1回答

如何使用Patsy爲模型選擇創建所有可能的公式組合？

我目前使用Python的Patsy模塊爲我的模型創建矩陣輸入。例如，我可能會使用一個公式是 'Survived ~ C(Pclass) + C(Sex) + C(honor) + C(tix) + Age + SibSp + ParCh + Fare + Embarked + vowel + middle + C(Title)' 不過，我想執行模型選擇，所以我想從 'Survived ~ Ag

0熱度

1回答

python patsy三次樣條截距項

我試圖理解python庫中的三次樣條生成。據我可以從 import numpy as np from patsy import dmatrix x = np.linspace(0., 1., 100) y1 = dmatrix("bs(x, df=6, degree=3, include_intercept=True)", {"x": x}) print(y1) y2 = dmatri