chi-squared

    -1熱度

    1回答

    嗨,我真的覺得我錯過了一些東西,但我無法弄清楚如何計算數據幀上的chisq。 我有一個像測試一樣的數據框,我該如何計算一個chisq來確定一個類別的頻率是否比整個集合高。 我也想爲所有類別執行它。 cat <- c("aa","bb","cc","dd","aa","cc","bb","aa") variable <- c(1,1,0,1,0,0,0,1) test <- as.data.fr

    3熱度

    1回答

    我正在使用scipy.stats.chi2_contingency方法來獲得卡方統計。我們需要通過頻率表,即應急表作爲參數。但我有一個特徵向量,並希望自動生成頻率表。我們有這樣的功能嗎? 我做它像這樣目前: def contigency_matrix_categorical(data_series,target_series,target_val,indicator_val): obse

    2熱度

    1回答

    anderson函數只要求一個參數,並且應該是一維數組。所以我想知道如何傳遞兩個不同的數組進行比較呢? 由於

    0熱度

    2回答

    我有一個麥克斯韋分佈觀察,我符合預期的麥克斯韋分佈。然後我進行卡方檢驗以找出合適的好處。然而,我得到了很好的結果,我也想知道卡方檢驗使用的自由度。引用文檔chisquare :使用具有k-1-ddof自由度的卡方分佈計算p值,其中k是觀察到的頻率的數量。 ddof的默認值爲0. 什麼是k在這裏?這是我擁有的數據點總數(41000)嗎?或者它是每個垃圾箱的頻率?

    0熱度

    1回答

    這不是一個真正的編碼問題,而是更多的統計問題。 我正在對多個主題的多個比例進行比例測試。例如,主題1將具有多個比例(多個「每次總試驗的成功次數」),並且主題2將具有多個比例。對於我們正在測試的每個主題,如果所有這些比例是相同的。對於每個科目,在每個總試驗中有多少成功的情況下有多個比例。這個比例可以從60分之中的30個成功到1000分之中的300個成功(僅顯示每個主題的試驗和成功的範圍)。此外,對於

    1熱度

    2回答

    我正在嘗試使用R來運行學生t檢驗和卡方檢驗與大型數據集。由於我對R相當陌生,因此我的經驗不足使我在自己的代碼中取得了很大的成功。 兩組數據有丟失的數據,並期待這樣的: AA assayX activity assayY1 activity assayY2 activity chemical 1 TRUE 0 12.2 chemical 2 T

    2熱度

    1回答

    我對C中的編碼非常陌生,我正在計算給定值和自由度的卡方分佈的CDF。有沒有這樣做的函數或庫,還是我需要自己編寫此代碼? 任何幫助,將不勝感激

    3熱度

    1回答

    我想對我給出的不同數據執行所謂的Ljung Box測試。我想檢查我的數據是否在卡方分佈的0.95分位數內。這個值我可以在表格中找到(如http://www.unc.edu/~farkouh/usefull/chi.html)。數據具有不同的樣本大小,導致卡方分佈的不同自由度,並且手動查找所有值會花費大量時間。 我想知道在matlab中是否有任何方法可以自動找到這些值,然後在我的for循環中使用這些

    0熱度

    2回答

    我是R的新手 由於需要我的項目,我需要對數十萬個條目進行Chisq測試。 我自己學習了幾天,並編寫了一些代碼,用於在循環中運行chisq.test。 代碼: the.data = read.table ("test_chisq_allelefrq.txt", header=T, sep="\t",row.names=1) p=c() ID=c() for (i in 1:nrow(the.d

    0熱度

    1回答

    我發佈了關於stat stack exchange的問題,但不幸的是到目前爲止還沒有答案,所以我在這裏克隆它,並希望有人能夠提供幫助。 我是機器學習的新手。最近我試圖學習這件事,並得到以下關注: 我有產品分類的類別。此外,我還向用戶提供性別和設備型號信息。 首先,我做了一個卡方檢驗,檢查類別和性別+設備信息是否關聯。例如,我的p值是0.000012,所以我說用戶(性別+設備)與類別相關聯。 因此,