chi-squared

-1熱度

1回答

嗨，我真的覺得我錯過了一些東西，但我無法弄清楚如何計算數據幀上的chisq。我有一個像測試一樣的數據框，我該如何計算一個chisq來確定一個類別的頻率是否比整個集合高。我也想爲所有類別執行它。 cat <- c("aa","bb","cc","dd","aa","cc","bb","aa") variable <- c(1,1,0,1,0,0,0,1) test <- as.data.fr

3熱度

1回答

我們可以使用python爲chisquare測試生成列聯表嗎？

我正在使用scipy.stats.chi2_contingency方法來獲得卡方統計。我們需要通過頻率表，即應急表作爲參數。但我有一個特徵向量，並希望自動生成頻率表。我們有這樣的功能嗎？我做它像這樣目前： def contigency_matrix_categorical(data_series,target_series,target_val,indicator_val): obse

2熱度

1回答

我們如何在scipy.stats.anderson_ksamp中傳遞兩個數據集？任何人都可以用一個例子來解釋嗎？

anderson函數只要求一個參數，並且應該是一維數組。所以我想知道如何傳遞兩個不同的數組進行比較呢？由於

0熱度

2回答

在scipy中查找卡方檢驗的自由度？

我有一個麥克斯韋分佈觀察，我符合預期的麥克斯韋分佈。然後我進行卡方檢驗以找出合適的好處。然而，我得到了很好的結果，我也想知道卡方檢驗使用的自由度。引用文檔chisquare ：使用具有k-1-ddof自由度的卡方分佈計算p值，其中k是觀察到的頻率的數量。 ddof的默認值爲0. 什麼是k在這裏？這是我擁有的數據點總數（41000）嗎？或者它是每個垃圾箱的頻率？

0熱度

1回答

在R的Prop.Test：如何糾正大量的觀察

這不是一個真正的編碼問題，而是更多的統計問題。我正在對多個主題的多個比例進行比例測試。例如，主題1將具有多個比例（多個「每次總試驗的成功次數」），並且主題2將具有多個比例。對於我們正在測試的每個主題，如果所有這些比例是相同的。對於每個科目，在每個總試驗中有多少成功的情況下有多個比例。這個比例可以從60分之中的30個成功到1000分之中的300個成功（僅顯示每個主題的試驗和成功的範圍）。此外，對於

1熱度

2回答

循環學生T檢驗和Chi-Squared中缺失數據R

我正在嘗試使用R來運行學生t檢驗和卡方檢驗與大型數據集。由於我對R相當陌生，因此我的經驗不足使我在自己的代碼中取得了很大的成功。兩組數據有丟失的數據，並期待這樣的： AA assayX activity assayY1 activity assayY2 activity chemical 1 TRUE 0 12.2 chemical 2 T

2熱度

1回答

在C中計算卡方CDF

我對C中的編碼非常陌生，我正在計算給定值和自由度的卡方分佈的CDF。有沒有這樣做的函數或庫，還是我需要自己編寫此代碼？任何幫助，將不勝感激

3熱度

1回答

查找卡方分佈的分位數值在MATLAB中

我想對我給出的不同數據執行所謂的Ljung Box測試。我想檢查我的數據是否在卡方分佈的0.95分位數內。這個值我可以在表格中找到（如http://www.unc.edu/~farkouh/usefull/chi.html）。數據具有不同的樣本大小，導致卡方分佈的不同自由度，並且手動查找所有值會花費大量時間。我想知道在matlab中是否有任何方法可以自動找到這些值，然後在我的for循環中使用這些

0熱度

2回答

如何在循環中運行chisq.test使用apply

我是R的新手由於需要我的項目，我需要對數十萬個條目進行Chisq測試。我自己學習了幾天，並編寫了一些代碼，用於在循環中運行chisq.test。代碼： the.data = read.table ("test_chisq_allelefrq.txt", header=T, sep="\t",row.names=1) p=c() ID=c() for (i in 1:nrow(the.d

0熱度

1回答

Chi square和zscore - 選擇哪一個？

我發佈了關於stat stack exchange的問題，但不幸的是到目前爲止還沒有答案，所以我在這裏克隆它，並希望有人能夠提供幫助。我是機器學習的新手。最近我試圖學習這件事，並得到以下關注：我有產品分類的類別。此外，我還向用戶提供性別和設備型號信息。首先，我做了一個卡方檢驗，檢查類別和性別+設備信息是否關聯。例如，我的p值是0.000012，所以我說用戶（性別+設備）與類別相關聯。因此，