random-sample

    0熱度

    3回答

    我有一個(可能很簡單)的問題,我無法弄清楚。 我想寫一個循環(或使用mapply或ddply?)從多個數據子集中隨機抽樣三個值,並找到該隨機樣本的平均值並將其放入數據框中。 例如,這裏是數據的一小部分: BayStation DIN Year 1 60069 0.0090 1998 2 60069 0.0060 1998 3 60069 0.0100 1998 4 60069

    2熱度

    5回答

    我需要在Python中模擬超幾何分佈(用於取樣元素而不是替換的花式詞)。 設置:有一袋裝滿了人口很多彈珠。有兩種類型的彈珠,紅色和綠色(在以下實現中,彈珠表示爲True和False)。從袋中取出的彈珠量爲樣品。 以下是兩種實現我想出了這個問題,但是他們都開始在人口速度降低> 10^8 def pull_marbles(sample, population=100): assert pop

    4熱度

    1回答

    下面我有句話 The boy is {good|better|best} in his {school|tution|class|scociety} 現在我需要創建一個遞歸PHP函數將採取這句話作爲輸入,將輸出象下面這樣: - The boy is good in his school The boy is good in his tution 以類似的方式我需要創建12行,因爲上面的句

    0熱度

    2回答

    我已產生的隨機號從1到539與尺寸是269. train=randint(1,539,269) 現在我想生成不包含列車數據號

    1熱度

    1回答

    我想腳本隨機分配例程。抽樣設計有一個區域被分成許多多邊形或地層。一套但不同數量的樣本將隨機分配到每個層(最少2個樣本,但某些層中多達7個)。因此,我有一個地層的形狀文件,並在其屬性表中列出了每個地層所需的地層名稱和樣本數量。 STRATA;樣品 440; 4 441; 2 5Z3; 4 5Z1; 7 560; 2 我發現這些類型的採樣設計(http://casoilresource.lawr.uc

    0熱度

    1回答

    我想創建如下隨機樣本(30-70) - : set @total=(select count(*) from tab_1 where predict_var ="4" or predict_var ="2") ; set @sample= (select @total*(70/30)) ; #@total,@sample #4090,9543.333331970 #發佈此我可以通過這個

    0熱度

    1回答

    我有一個大約有4M節點的大圖。該圖包含兩個文件,一個包含節點名稱,另一個包含邊(每行代表一條邊)。我想要統一採樣圖形節點,並獲得一個大到整個圖形15%的樣本。考慮圖的大小,生成這樣一個樣本的最佳方法是什麼(或可能)?

    3熱度

    1回答

    是否有可能將預備表的結果存儲在mysql中? 我的使用情況是 -: 我基於源表的某些條件下創建兩個變量,然後獲取隨機行,在此基礎上的標準。因爲我有這樣的表的10,I應該是第一連接它們,然後做此隨機化的「整體」的超車/過濾標準(也見下文@total,這是我的主要標準,PER表) set @total=(select count(*) from tab_1 where predict_var ="4"

    0熱度

    1回答

    如果我有一個學生#120的工作表和一個教師#40的工作表。 我該如何爲每位老師分配三位學生 - 我可以使用= RAND功能,但是允許重複嗎?

    1熱度

    1回答

    我們正在使用IBM的Netezza。我們有一張桌子,每天有近100億條記錄需要處理。表中的一個字段通過38個字符的數字字符串標識用戶,我們稱之爲UserID。我們有這張表分佈在UserID上。我正在尋找最佳的抽樣技術。目前,我們使用mod(UserID,SamplingRate)= 0進行了示例,但由於此表分佈在UserID上,因此我認爲肯定有更好的方法。 在Hive中,我們有桶的概念,在這裏我們