0
所以,我知道,在R您可以在此形式邏輯迴歸提供數據:你可以在sklearn邏輯迴歸輸入中使用計數嗎?
model <- glm(cbind(count_1, count_0) ~ [features] ..., family = 'binomial')
有沒有辦法做這樣的事情cbind(count_1, count_0)
與sklearn.linear_model.LogisticRegression?還是我實際上必須提供所有這些重複的行? (我的功能是分類的,所以會有很多冗餘。)
也許我的問題還不清楚。我知道如何製作虛擬矩陣。我問的是如何,而不是發送帶有指示符變量1和0的行,而是總結所有相同的行,併發送(80 1,10,0),而不是具有所有相同特徵的90行。 – Erin
@Erin,嗯,我還是不明白你的意思。也許你想使用稀疏矩陣? 「排」是指你的數據集的單獨樣本? –
我認爲稀疏是指特徵,而不是結果。我找到了一種方法來處理statsmodels而不是sklearn [這裏](http://statsmodels.sourceforge.net/devel/examples/notebooks/generated/glm.html)。 – Erin