我有一臺高斯隨機分佈假設250個網址:在PostgreSQL
create table url (
id serial,
url varchar(64)
)
這些URL對應每一個網站。每個網站都有不同的受歡迎程度。比方說,在id=125
(一箇中心高斯)是最流行的,那些在id=1
或id=250
是最流行的。
我要填充像下面這樣一個與在「URL」表中提供的那些中的URL的值的「日誌」表,但考慮到不同的URL可能會更頻繁地出現。(對於爲例URL,其ID是125將是最受歡迎的)。
create table log (
id serial,
url_id integer
)
我想避免使用random()
,因爲它是統一的,不是很「真實」。
怎麼可以這樣PostgreSQL的實現?
爲什麼你認爲知名度和排名有高斯分佈的? – wildplasser 2012-02-24 13:59:20
可以計算使用利用RAND該分佈的PDF任何分佈(其產生在0和1之間的值,是嗎?)。對於高斯發行版,這將是1/2(1 + erf(x-mu)/ sqrt(2sigma^2)) - 見http://en.wikipedia.org/wiki/Normal_distribution – 2012-02-24 14:05:46
@wildplasser:因爲該法似乎對我嘗試建模的東西非常有用。我承認它可能是其他的! – SCO 2012-02-24 15:18:22