statistics

    -1熱度

    3回答

    我正在嘗試生成一些數據,例如:年齡與一週內堆棧溢出花費的小時數。我嘗試使用randn函數,但它不能控制生成的值的範圍和值的量化。我嘗試了一些算法,例如盒子加工方法,但同樣的問題也出現在那裏。可以生成兩個均勻變量,但對正態分佈值的控制是什麼?有人可以解釋我,我怎麼可以在Python中執行此操作?

    2熱度

    2回答

    我對Python很新,所以我認爲這可能是一個基本問題。我在網上找到了一些解決方案,但無法找到我正在尋找的確切的東西。目前我正在尋找一種方法來查找超過3列數據的「低中位數」。如果只有2列的3列填充,那麼我想採取較低的值。 以下是我發現至今 df['median']=np.nanmedian(df[['val1','val2','val3']], axis=1) 以上不是一個可行的解決方案,因爲我

    1熱度

    1回答

    我剛剛遇到了使用integral2或integral3在MATLAB中計算CDF的問題。假設我有兩個獨立的正態隨機變量X和Y,平均值向量是mu = [5;50],協方差矩陣是c = [3^2,0; 0,3^2]。 因爲它們是獨立的,聯合PDF是兩個PDF的乘法,我用下面的代碼來計算的概率在整個域, integral2(@(x,y) normpdf(x,5,3).*normpdf(y,50,3),-

    1熱度

    1回答

    我在使用合意包進行優化時遇到了R代碼問題,因此我的工作基於this document。 我的代碼是這樣的: library(desirability) #Desirability function ##Function creation Aldeh_ther<-function(x) ((1/(-0.4349834+(0.0150467*x[1])+(0.0086295*x[2])-(0.

    0熱度

    1回答

    我想用多個分子/粒子對布朗運動進行建模並對它們進行動畫處理。到目前爲止,我已經拿出了這個代碼解決方案,但我無法得到期望的結果。以下是我的代碼 N = 500; % number of samples tau = .1; % time interval in seconds D = 10; % diffusion coefficient NumMolecules = 500; % number

    -1熱度

    2回答

    我正在處理我的字段中的統計分析,並使用C++。我正在實施幾項測試,其中一些需要比較計算值與表格,比如分配表格,例如this one. 我希望我的不同類別中的不同功能能夠訪問特定值,來評價我的結果的意義,例如像這樣: float F = fisherTest(serie1, serie2); auto tableValue = findValue(serie1.size(), serie2.siz

    2熱度

    1回答

    所以我有這個離散數據集合my_dat,我試圖擬合曲線以便能夠根據my_dat生成隨機變量。我在連續數據上使用fitdistrplus取得了巨大成功,但嘗試將其用於離散數據時出現了許多錯誤。 表設置: library(fitdistrplus) my_dat <- c(2,5,3,3,3,1,1,2,4,6, 3,2,2,8,3,4,3,3,4,4, 2,1,5,3,

    -1熱度

    1回答

    我在計算轉移概率矩陣時遇到了麻煩。我有幾個ID和他們的搜索模式(頁面訪問)。例如: Id Page 1 A 1 A 1 B 2 C 2 C 3 D 3 E 3 F 1 D 1 G 4 G 4 C 4 H 2 D 2 C 我也有頁面的初始概率:P_a,....,P_h。如何在R(最好)或Python中進行編碼,以獲得所有id的Page變量的轉換概率矩陣。我知道如何做

    0熱度

    2回答

    我正在使用R執行我的分析,我將執行四種算法。 1. RF 2. Log Reg 3. SVM 4. LDA 我有50個預測變量和1個目標變量。我所有的預測變量和目標變量都只有二進制數字0和1。 我有以下問題: Should I convert them all into factors? Converting them into factors, and applying RF alg

    2熱度

    1回答

    我試圖顯示非對稱t分佈或正態分佈是否更適合某個數據集。在這樣做時,我決定疊加一個擬合的正態分佈和一個擬合的t分佈。對於正態分佈,這是沒有問題的使用stat_fun: x <- data.frame(rnorm(500)) names(x) <- c("test.data") ggplot(x,aes(x=test.data)) + stat_function(fu