random-sample

0熱度

3回答

我有一個（可能很簡單）的問題，我無法弄清楚。我想寫一個循環（或使用mapply或ddply？）從多個數據子集中隨機抽樣三個值，並找到該隨機樣本的平均值並將其放入數據框中。例如，這裏是數據的一小部分： BayStation DIN Year 1 60069 0.0090 1998 2 60069 0.0060 1998 3 60069 0.0100 1998 4 60069

2熱度

5回答

模擬從沒有更換的袋子中拉出大理石（高效）

我需要在Python中模擬超幾何分佈（用於取樣元素而不是替換的花式詞）。設置：有一袋裝滿了人口很多彈珠。有兩種類型的彈珠，紅色和綠色（在以下實現中，彈珠表示爲True和False）。從袋中取出的彈珠量爲樣品。以下是兩種實現我想出了這個問題，但是他們都開始在人口速度降低> 10^8 def pull_marbles(sample, population=100): assert pop

4熱度

1回答

完成與詞的多次數的句子

下面我有句話 The boy is {good|better|best} in his {school|tution|class|scociety} 現在我需要創建一個遞歸PHP函數將採取這句話作爲輸入，將輸出象下面這樣： - The boy is good in his school The boy is good in his tution 以類似的方式我需要創建12行，因爲上面的句

0熱度

2回答

提取兩個隨機樣本集合在python

我已產生的隨機號從1到539與尺寸是269. train=randint(1,539,269) 現在我想生成不包含列車數據號

1熱度

1回答

分配隨機樣本到多邊形

我想腳本隨機分配例程。抽樣設計有一個區域被分成許多多邊形或地層。一套但不同數量的樣本將隨機分配到每個層（最少2個樣本，但某些層中多達7個）。因此，我有一個地層的形狀文件，並在其屬性表中列出了每個地層所需的地層名稱和樣本數量。 STRATA;樣品 440; 4 441; 2 5Z3; 4 5Z1; 7 560; 2 我發現這些類型的採樣設計（http://casoilresource.lawr.uc

0熱度

1回答

正確語法限制工會和秩序與局部變量和隨機在MySQL條款：錯誤（1221）

我想創建如下隨機樣本（30-70） - ： set @total=(select count(*) from tab_1 where predict_var ="4" or predict_var ="2") ; set @sample= (select @total*(70/30)) ; #@total,@sample #4090,9543.333331970 ＃發佈此我可以通過這個

0熱度

1回答

如何統一採樣大圖？

我有一個大約有4M節點的大圖。該圖包含兩個文件，一個包含節點名稱，另一個包含邊（每行代表一條邊）。我想要統一採樣圖形節點，並獲得一個大到整個圖形15％的樣本。考慮圖的大小，生成這樣一個樣本的最佳方法是什麼（或可能）？

3熱度

1回答

將準備好的語句的結果作爲表存儲在mysql中？

是否有可能將預備表的結果存儲在mysql中？我的使用情況是 -：我基於源表的某些條件下創建兩個變量，然後獲取隨機行，在此基礎上的標準。因爲我有這樣的表的10，I應該是第一連接它們，然後做此隨機化的「整體」的超車/過濾標準（也見下文@total，這是我的主要標準，PER表） set @total=(select count(*) from tab_1 where predict_var ="4"

0熱度

1回答

隨機平均地將大列表中的學生分配給小列表中的教師

如果我有一個學生＃120的工作表和一個教師＃40的工作表。我該如何爲每位老師分配三位學生 - 我可以使用= RAND功能，但是允許重複嗎？

1熱度

1回答

Netezza /大型數據庫的採樣數據技術

我們正在使用IBM的Netezza。我們有一張桌子，每天有近100億條記錄需要處理。表中的一個字段通過38個字符的數字字符串標識用戶，我們稱之爲UserID。我們有這張表分佈在UserID上。我正在尋找最佳的抽樣技術。目前，我們使用mod（UserID，SamplingRate）= 0進行了示例，但由於此表分佈在UserID上，因此我認爲肯定有更好的方法。在Hive中，我們有桶的概念，在這裏我們