chi-squared

    3熱度

    1回答

    我一直試圖通過最小化卡方來將線性模型擬合到一組應力/應變數據。不幸的是,使用下面的代碼不能正確地最小化chisqfunc函數。它在最初的條件下找到最小值x0,這是不正確的。我瀏覽了scipy.optimize文檔,並測試了最小化其他正常工作的功能。你能否建議如何修正下面的代碼或者建議另一種方法來將線性模型擬合到數據中,通過最小化卡方? import numpy import scipy.opti

    3熱度

    2回答

    我有一個包含幾個問題(列)編碼爲1 =同意/ 0 =不同意的調查數據框。受訪者(行)根據「年齡」(「年輕」,「中間」,「舊」),「地區」(「東」,「中」,「西」)等指標進行分類。大約有30類(3個年齡段,3個地區,2個性別,11個職業等)。在每個指標中,類別不重疊且大小不同。 這是模擬數據集的一個簡化版本: n<-400 set.seed(1) data<-data.frame(age=sam

    1熱度

    1回答

    我有兩個表,並通過 CROSSTABS /TABLES = table1 BY table2 /STATISTICS=CHISQ. 您收到的結果也爲卡方檢驗表不僅2表。 但這對我來說信息太多。我需要的只是一個文本輸出: "the chi test is fine/ not fine." via sth。像 COMPUTE new_variable = 16.92 - chisq_val

    4熱度

    1回答

    我對R很新,所以請耐心等待。我使用卡方檢驗對核苷酸的頻率在給定的位置進行比較,並且我計數A,C,G,T的在兩個不同的數據集的數目: x1 <- c(272003,310418,201601,237168) x2 <- c(239614,316515,182070,198025) 我可以想到兩種辦法要求兩樣本卡方檢驗: > chisq.test(x1,x2) Pearson's C

    4熱度

    1回答

    在熊貓中,我試圖手動編碼卡方檢驗。我在下面的數據框中比較row 0和row 1。 data 2 3 5 10 30 0 3 0 6 5 0 1 33324 15833 58305 54402 38920 爲此,我需要計算每個單元格的預期單元格數爲:cell(i,j) = rowSum(i)*colSum(j)/sumAll。在R,我可以簡單地通過採取outer

    5熱度

    1回答

    我正在嘗試使用scipy.stats.chisquare。我建立了一個玩具例子: In [1]: import scipy.stats as sps In [2]: import numpy as np In [3]: sps.chisquare(np.array([38,27,23,17,11,4]), np.array([98, 100, 80, 85,60,23])) Out[11

    -4熱度

    1回答

    有沒有辦法將chi sq測試的置信度從95%設置爲99%? 基礎功能 chisq.test() 不要抱怨這個功能... 編輯: 我不要求p值。我的問題是關於信心風險。 chisq測試的α風險(置信度)默認爲0.05。我想將它設置爲0.01(99%的置信度)。 alpha風險是統計量X的截斷值。對於給定的Chi分佈「x」自由度,alpha風險對應於「X風險統計量」。如果'我們數據的X統計量'大於'X

    0熱度

    1回答

    欲進行配合測試的理論卡方優度: actual <- c(20,80) expected <- c(10,90) chisq.test(expected,actual) 樣品大小n = 100,α= 0.05,DF = 1。這給出了3.84的關鍵氣味值。 (20-10)^ 2)/ 10 +((80-90)^ 2)/ 90 = 100/9> 3.84 然而,上面的代碼只是產生 Pearson'

    -1熱度

    1回答

    我有兩個向量,其中都有NA值。我試圖找到我的兩個向量創建的表卡方值,但我得到這個錯誤: Error in chisq.test(data.table) : all entries of 'x' must be nonnegative and finite 是否有一個代碼從表中刪除NA值? 我沒有找到一些代碼來做這個向量,但我不知道這是如何工作的。如果NA值從一個向量中刪除,那麼來自另一個向量的相應

    1熱度

    2回答

    我想實現卡方的算法是: Distance= 1/2* Ei((Xi-Yi)^2/Xi+Yi) instead of euclidean distance which algorithm is: Distance= Sqrt(E(Xi-Yi)^2) in calculating distance between 2 SIFT feature (128 dimensional vector),