statsmodels

    3熱度

    1回答

    我不確定什麼是最好的/最具統計性的完成我想要的東西的方法,但我基本上試圖採用p值的分佈並將其與通過排列我的原始數據而創建的更大的p值分佈。我正在處理小的p值,所以我實際上比較了p值的log10。 我一直在試圖找出一個很好的通用方法來比較兩個數組具有相似值但長度不相等的方法。我真正想要的是類似於scipy.qqplot(dataset1, dataset2)的東西,但不存在,Q-Q圖只會將您的分佈與

    4熱度

    2回答

    我正在試驗以決定是否與自身相關的時間序列(如在,一個浮點列表)。我已經在statsmodels(http://statsmodels.sourceforge.net/devel/generated/statsmodels.tsa.stattools.acf.html)中使用了acf函數,現在我正在研究Durbin-Watson統計是否有任何價值。 好像這種事情應該工作: from statsmod

    3熱度

    2回答

    假設我有一個pandas數據幀: df = pd.DataFrame({'x1': [0, 1, 2, 3, 4], 'x2': [10, 9, 8, 7, 6], 'x3': [.1, .1, .2, 4, 8], 'y': [17, 18, 19, 20, 21]}) 現在我適合使用公式(使用patsy引擎蓋下)一個statsmodel

    0熱度

    1回答

    我有這個問題。我正在嘗試做線性迴歸並測試斜率。 t檢驗檢查斜率是否遠離0.斜率可以是負值也可以是正值。我只對負斜率感興趣。 在這個例子中,斜率是正值,我不感興趣,所以P值應該很大。但它很小,因爲現在它測試斜率是否遠離0,在任一方向。 (我強制截取零,這是我想要的)。有人可以用語法來幫助我看看斜率是否只有負值。在這種情況下,P值應該很大。 而我該如何改變,說99%的置信度或95%或......?對於

    2熱度

    2回答

    我很喜歡在statsmodels中使用線性LASSO迴歸,所以爲了能夠使用「公式」表示法來編寫模型,這將爲處理很多分類變量以及它們的交互時節省相當多的編碼時間。但是,它似乎還沒有在統計模型中實現?

    0熱度

    1回答

    我試圖從statsmodels庫在Python運行X-13-ARIMA模型3. 我發現statsmodels文檔這個例子: dta = sm.datasets.co2.load_pandas().data dta.co2.interpolate(inplace=True) dta = dta.resample('M').sum() res = sm.tsa.x13_arima_select

    1熱度

    2回答

    我運行一個ols模型,我需要知道所有的係數,所以我可以在我的分析中使用它們。我如何以不同於科學記數法的格式顯示/保存係數? model = sm.ols(formula="sales ~ product_category + quantity_bought + quantity_ordered + quantity_returned + season", data=final_email).fit

    0熱度

    1回答

    我有一個for循環遍歷機器學習算法列表,我想對機器學習模型的結果執行T檢驗。 import pandas import numpy from pandas.tools.plotting import scatter_matrix import matplotlib.pyplot as plt from sklearn import preprocessing from sklearn i

    0熱度

    1回答

    每當我嘗試使用pip或easy_install安裝「Statsmodels」時,顯示以下錯誤。 enter image description here 我試圖單獨安裝scipy,同樣的事情發生。該怎麼辦?

    0熱度

    1回答

    我使用adfuller來確定隨機模擬的輸出是否達到平衡。我認爲增強型Dickey Fuller測試可以實現這一任務,但它發現數值仍不穩定的平穩性。例如,該圖像中的值都有明確減少: time series 但運行以下命令: results = = adfuller(values, regression="c") 我得到這個結果: p值:8.73279419229e- 06 adf:-5.2014