0

我想要生成具有2個標籤01的隨機數據集。這是我的分佈:使用Python在k-NN中生成二進制分類的數據集

p(x|y = 0) = N(x1;µ1,σ2 1)N(x2;µ2,σ2 2) 
p(x|y = 1) = N(x1;µ3,σ2 3)N(x2;µ4,σ2 4) 

其中x =(x1,x2)T包含兩個連續值屬性。

如何使用python解決它?我應該使用哪個庫?謝謝。

回答

1

有很多可能性,可能是simpliest是隻使用numpyrandom number generator,從而

import numpy as np 
N = 100 

mean1, mean2, std1, std2 = 1, 5, 2, 3 
x0 = np.random.normal(loc=[mean1, mean2], scale=[std1, std2], size=(N, 2)) 

mean3, mean4, std3, std4 = 2, -2, 1, 0.1 
x1 = np.random.normal(loc=[mean3, mean4], scale=[std3, std4], size=(N, 2))