比方說,我有10.000線(佔10.000人)和下面的表:選擇「相似」組 - 從概率開始?
id qualification gender age income
當我選擇具有一定資格的所有人員(說「水管工」)我得到100線,具有某些性別,年齡和收入分配。
我現在想要做的是選擇某種測試組來檢查收入是否受到資質或其他屬性的分配。
這意味着(現在我回到我的問題)我想獲得另一組100行,具有相同的性別和年齡分佈(但具有不同的限定值)。這100行應該是隨機選擇的。
我的主要問題是,當我選擇隨機行時,我不知道如何編寫一個SQL命令來處理分佈(當然可以或許應該被看作是這種情況下的概率)。
預先感謝您!
謝謝!我認爲這對於簡單的測試組檢查來說太複雜了。我會看看我是否可以用重量去代替。 – speendo