patsy

    1熱度

    1回答

    我給了一個沒有響應變量的測試集。我已經建立了模型並需要預測測試集中的響應變量。 我在格式化測試設計矩陣時遇到問題,因此它會兼容。 我正在使用patsy庫構造矩陣。 我想要做這樣的事情,除了下面的代碼不起作用: X = dmatrices('Response ~ var1 + var2', test, return_type = 'dataframe') 什麼是正確的做法?感謝

    1熱度

    1回答

    假設我有一個RxC contingency table。這意味着有R行和C列。我想要一個尺寸爲RC×(R + C - 2)的矩陣X,它包含行 的R-1「主效應」和列的C-1「主效應」。例如,如果你具有R = C = 2(R = [0,1],C = [0,1])和唯一的主效應,有各種方法來參數設計矩陣(X),但低於是一種方法: 1 0 0 1 1 0 0 0 注意,這是4×2 = RC X

    0熱度

    2回答

    我有這樣一個數據幀的交互虛擬變量: Index ID Industry years_spend asset 6646 892 4 4 144.977037 2347 315 10 8 137.749138 7342 985 1 5 104.310217 137 18 5 5 156.593396 2840 381 11 2 229.538828 6

    0熱度

    1回答

    我正在使用patsy爲迴歸準備分類數據,並且想要將列名映射到其DesignMatrix中的索引。我已嘗試使用DesignInfo對象的column_name_indexes屬性,但列名已被修改以反映編碼。 實施例使用從docs數據: >>> from patsy import demo_data, dmatrix >>> data = demo_data("a", nlevels=3) >>>

    -1熱度

    2回答

    我想創建從我的數據分類變量用這種方法: cat.var condition 1 x > 10 2 x == 10 3 x < 10 我嘗試使用從patsyC() method,但它不工作,我知道在Stata我有以下使用的代碼,但搜索後,我沒有找到任何清潔方式pyhton做到這一點: generate mpg3 = . (74 missing values generate

    1熱度

    1回答

    python和機器學習頗爲新穎。 我想建立一個邏輯迴歸模型。我曾在R工作獲得lambda,並使用交叉驗證來找到最好的模型,現在將它移入python。 在這裏,我創建了一個設計矩陣,使其變得稀疏。然後運行邏輯迴歸。它似乎在工作。 我的問題是,因爲我已經說過我的術語item_number是一個類如何知道哪個變成了虛擬變量?我怎麼知道哪個係數與每個類別名稱一致? from patsy import dm

    3熱度

    2回答

    假設我有一個pandas數據幀: df = pd.DataFrame({'x1': [0, 1, 2, 3, 4], 'x2': [10, 9, 8, 7, 6], 'x3': [.1, .1, .2, 4, 8], 'y': [17, 18, 19, 20, 21]}) 現在我適合使用公式(使用patsy引擎蓋下)一個statsmodel

    17熱度

    1回答

    我工作的一個應用程序,它是一種「預測模型作爲一種服務」,結構如下: 火車模型離線 定期上傳模型參數的「預測服務器「 預測服務器需要輸入一個單一的觀察,並輸出預測 我試圖使用懦夫,但是遇到了以下問題:當一個預測進來,我怎麼轉換它正確的形狀,使它看起來像是一排訓練數據? 的帕齊文檔提供了一個例子,當從訓練數據的DesignInfo可用存儲:http://patsy.readthedocs.io/en/

    1熱度

    1回答

    我目前使用Python的Patsy模塊爲我的模型創建矩陣輸入。例如,我可能會使用一個公式是 'Survived ~ C(Pclass) + C(Sex) + C(honor) + C(tix) + Age + SibSp + ParCh + Fare + Embarked + vowel + middle + C(Title)' 不過,我想執行模型選擇,所以我想從 'Survived ~ Ag

    0熱度

    1回答

    我試圖理解python庫中的三次樣條生成。據我可以從 import numpy as np from patsy import dmatrix x = np.linspace(0., 1., 100) y1 = dmatrix("bs(x, df=6, degree=3, include_intercept=True)", {"x": x}) print(y1) y2 = dmatri