1
測試它我知道,鑑於其產生的隨機數均勻分佈的一毫克,一種方法來獲得功率狀數據是,以下Wolfram Mathworld以下:令y是隨機可變均勻地分佈在(0,1)和x分佈爲P另一個隨機變量(x)= C * X ** N(用於(XMIN,XMAX X))。我們有生成在C冪律分佈並用蟒
x=[ (xmax**(n+1) - xmin**(n-1))y+xmin**(n+1) ]**(1/(n+1))
所以我用C,其生成從1 50k的編號,以100應被分佈爲使這個節目x ^( - 2),並打印上的文件DATA.TXT成果的頻率:
void random_powerlike(int *k, int dim, double degree, int xmin, int xmax, unsigned int *seed)
{
int i;
double aux;
for(i=0; i<dim; i++)
{
aux=(powq(xmax, degree +1) - powq(xmin, degree +1))*((double)rand_r(seed)/RAND_MAX)+ powq(xmin, degree +1);
k[i]=(int) powq(aux, 1/(degree+1));
}
}
int main()
{
unsigned int seed = 1934123471792583;
FILE *tmp;
char stringa[50];
sprintf(stringa, "Data.txt");
tmp=fopen(stringa, "w");
int dim=50000;
int *k;
k= (int *) malloc(dim*sizeof(int));
int degree=-2;
int freq[100];
random_powerlike(k,dim, degree, 1,100,&seed);
fprintf(tmp, "#degree = %d x=[%d,%d]\n",degree,1,100);
for(int j=0; j< 100;j++)
{
freq[j]=0;
for(int i = 0; i< dim; ++i)
{
if(k[i]==j+1)
freq[j]++;
}
fprintf(tmp, "%d %d\n", j+1, freq[j]);
}
fflush(tmp);
fclose(tmp);
return 0;
}
我決定pylab,以適應這些數字,看最好的冪律適合他們的東西作爲* X ** b,有b = -2。我在python寫了這個程序:
import numpy
from scipy.optimize import curve_fit
import pylab
num, freq = pylab.loadtxt("Data.txt", unpack=True)
freq=freq/freq[0]
def funzione(num, a,b):
return a*num**(b)
pars, covm = curve_fit(funzione, num, freq, absolute_sigma=True)
xx=numpy.linspace(1, 99)
pylab.plot(xx, funzione(xx, pars[0],pars[1]), color='red')
pylab.errorbar(num, freq, linestyle='', marker='.',color='black')
pylab.show()
print pars
的問題是,當我適合的數據,我得到〜-1.65的指數值。
我認爲我的地方犯了一個錯誤,但我想不出它在哪裏。
好,我」使用pow而不是powq(我使用powq是因爲在我的項目的其他部分需要四倍精度),我增加了大小爲5 * 10^5 sa mples。我注意到,有沒有辦法,我用得到的數據x = XMAX(在我的案件100)。仍然存在相同的問題:最適合的是x^{ - 1.6} ... –
也許問題是rand_r/RAND_MAX不足以生成均勻分佈的(僞)隨機數? –
@FrancescoDiLauro請檢查更新 –