statistics

    0熱度

    1回答

    我是熊貓的初學者。 用例是,我有一個包含實際數據的兩個dataframes一個(比如DF1): teamID yearID W 1B PAR 2B PAR 3B PAR HR PAR BB PAR 1366 LAA 1961 70 0.147748 0.035708 0.003604 0.030958 0.111548 1367 KC1 1961 61 0.164751 0.03598

    0熱度

    1回答

    我對我的RNG執行DieHarder測試,並且我想繪製結果的p值。 (Just like this guy does)。 所以,我不需要單個測試的最終p值,但是每個測試的p值的整個範圍(0,1]。 我能夠提取p值死忠的第一次測試,用詳細模式-v 1。 在輸出的盡頭,有100來分類的p值 一列。我認爲這是我要繪製什麼。 然而,我我不能使用-v 1與其他測試,他們只是產生了很多輸出(千兆字節!),它崩

    1熱度

    1回答

    我正在嘗試使用python找到學生化和PRESS殘差的多元迴歸模型。在這種情況下,我有以下數據: X1 X2 Y 14 25 301 19 32 327 12 22 246 11 15 187 與擬合模型爲:Y = 80.93-5.84 X1 + X2 11.32和MSresidual:574.9 我寫了下面的代碼,以找到那些殘留物。 import math def lin_mode

    -1熱度

    1回答

    假設我可以用連續隨機變量Y和可逆cdf FY生成樣本。我想知道FY(Y)(內外資本Y)的分佈情況如何? 我的主要猜測是一個統一的分佈,但我不知道如何驗證我的答案。

    2熱度

    1回答

    我的數據是一組Ñ觀察到對與它們的頻率,即,每對(X 我,Y 我)有對應一些ķ沿我,次的數目(×我,Y 我)進行了觀察。理想情況下,我想這兩者進行計算Kendall的tau和Spearman的Rho爲集這些對所有的副本,它由ķ + K + ... + K ň雙。的問題是,ķ + K 2 + ... + K Ñ,觀測的總數量,是巨大的,這樣的數據結構將不適合在存儲器中。 當然,我想有關分配的頻率我個對

    0熱度

    1回答

    我想知道是否有可能使用stats.linregress除了有固定截距,我目前做這,: from scipy import stats from numpy import arrange,array y = [0, 11, 19, 28, 41, 49, 62, 75, 81] xi = arange(0,9) scale, intercept, r_value, p_value, st

    0熱度

    1回答

    我有一個數據框,裏面包含了我用老鼠輸入的數據。 我不完全理解我得到的輸出。 SSQ =平方和。但是,哪個平方和?剩餘的平方和?或總平方數 - 殘差平方和?我假設後者,但我不確定。 df1有意義 - 它是每個變量-1內的組數。 df2我不明白。我有473個變量,以及20個老鼠的推測。但即使是473 x 20也不等於下面第一列的500萬! 此外,eta2是指單向anova的結果,partial-eta

    1熱度

    1回答

    我給了一個24位數字的排序數組d3.quantile並要求它計算第一個四分位數值。由於陣列可以平均分爲4組6個值,我的假設是結果將是arr [5]和arr [6]的平均值,但這不是我得到的。 var arr = [89.7, 93.2, 94, 94.3, 94.5, 95.4, 95.9, 96.1, 96.4, 96.5, 96.9, 96.9, 97.3, 97.6, 97.6, 97.6,

    0熱度

    1回答

    考慮一種分析方法,您需要在日期範圍內找出回頭客。重複客戶的日期範圍定義爲在起始範圍之前使用服務3 *(給定日期範圍時間間隔)的客戶,並且還使用特定日期範圍內的服務。 For example repeat customer for this week is all customers who used service 3 weeks before starting of this week and

    -1熱度

    3回答

    考慮由Seretosa,Versicolor和Virginica組成的虹膜數據集。對於4個變量有50個觀察值:萼片長度,萼片寬度,花瓣長度和花瓣寬度。如何使用R計算每個組的樣本協方差矩陣?