sample-size

    3熱度

    1回答

    我現在正在嘗試估計A/B測試網站轉換率所需的樣本大小。 pwr.chisq.test總是給我的錯誤信息,當我有轉化率的較小值: # conversion rate for two groups p1 = 0.001 p2 = 0.0011 # degree of freedom df = 1 # effect size w = ES.w1(p1,p2) pwr.chisq.te

    2熱度

    1回答

    我試圖用optimize()找n個以下函數的最小值(Clopper皮爾森下限): f <- function (n, p=0.5) (1 + (n - p*n + 1)/ (p*n*qf(p= .025, df1= 2*p, df2= 2*(n - p + 1))))^-1 這裏就是我試圖優化它: n_clop <- optimize(f.1, c(300,400), maximum

    2熱度

    1回答

    我期待在R中做一些基本的模擬來檢驗p值的性質。我的目標是看大樣本規模是否趨向於小p值。我的想法是生成1,000,000個數據點的隨機向量,將它們相互迴歸,然後繪製p值的分佈並查找偏斜。 這是我至今想: x1 = runif(1000000, 0, 1000) x2 = runif(1000000, 0, 1000) model1 = lm(x2~x1) 使用來自另一個線程採取代碼: lmp

    0熱度

    1回答

    我想對預訓練圖像分類模型的傳輸學習只有兩個類別,無論事件A是否發生。我知道再培訓本身非常有效。樣本量呢?我可以使用什麼樣的最小樣本量來獲得有意義的結果?

    2熱度

    2回答

    我有170本荷蘭文學小說的語料庫,我將在其上應用命名實體識別。對於荷蘭語的現有NER標籤的評估,我想手動註釋這個語料庫的隨機樣本中的命名實體 - 爲此我使用brat。手動註釋的隨機樣本將作爲我評估NER標籤的「黃金標準」。我寫了一個Python腳本,在句子級別輸出我的語料庫隨機樣本。 我的問題是:根據每部小說的句子數量,隨機樣本的理想大小是多少?就目前而言,我每條小說使用了100個句子,但是這導致

    0熱度

    1回答

    我有一個大數據庫從中我想創建的箱線圖: 數據:test.hospital Y:試驗結果(%):1500樣品中的總 X1:不同年(2011年至2017年) X2:不同醫院(30個不同醫院名稱) 樣本大小不同醫院很多,所以在某些情況下,實際上數據太少無法說明數據。因此,我想排除所有醫院從我的boxplot有樣本大小< 15. 所以我想要做的是創建一個額外的行頻率多少時間醫院採樣,並使用該行排除我的bo

    2熱度

    1回答

    我有大約25個不同組的數據。爲了瞭解如果我有不同的樣本規模,每個組的方差會發生怎樣的變化,我正在嘗試進行分層自舉。例如,在樣本大小爲5時,它應該爲每個組生成1000個5個重採樣點的集合。我喜歡根據需要收集最小樣本量,可能範圍爲每組5至30個。 我遇到的問題是我必須對每個組進行子集分類,然後在各個組上運行bootstrapping,然後將R輸出複製並過濾到excel中。 (我在R中相當綠色,以及如何

    1熱度

    1回答

    小免責聲明:我認爲發佈這個交叉驗證,但我覺得這更多與軟件實現有關。如果您不同意,可以遷移問題。 我正在試用包samplesize。我正試圖破譯n.ttest功能的k參數。該文件中指出: K個樣本部分ķ 這是不是非常有幫助。這個參數究竟是什麼? 我執行下述計算,所有的基本價值觀是在vals變量,這是我在下面提供: power <- 0.90 alpha <- 0.05 vals <- ??? #

    0熱度

    1回答

    我想知道是否可以在Python上使用分層聚類與不同樣本大小?更確切地說,用沃德的最小方差法。 例如,我有5個不同長度的整數列表A,B,C,D,E。我想要做的是根據Ward的方法將這5個列表分組爲3個組(被合併的集羣的方差減少)。 有誰知道如何做?

    -1熱度

    1回答

    我對閃亮相當新穎,而且我知道y的問題相當簡單,但儘管做了大量的研究,但我似乎無法使閃亮渲染輸出比例功率的測試。我試圖在用戶輸入所有參數(p1,p2,sig.level,power)的情況下創建腳本,並給出樣本大小n。我嘗試了許多不同的方法,但通常最終沒有輸出,或者錯誤「n」,「p1」,「p2」,「power」和「sig.level」中的某一個必須爲NULL「 。任何幫助表示讚賞,謝謝! 到目前爲止