2013-06-18 20 views
-2

我有100個記錄,我應用了聚類算法。 現在我想通過生成數據來增加我的數據集,就像我的實時數據具有相同的概率。任何人都可以提出解決方案最好在C#或SQL服務器中。 我已經看過DBMonster,但我不想隨機,我想要的數據就像我的樣本數據。 我已經嘗試了SQL數據生成器,但它也採取每列的最小和最大值,並隨機生成。如何生成像我的實時數據的數據?

+0

嗨歡迎來到StackOverflow。你需要更具體,並告訴我們你迄今爲止做了什麼。看看[問] – aiapatag

+1

使用你的真實數據? – DGibbs

回答

0

使用某種類型的統計建模軟件來提取現有數據的分佈(數學模型)。也許吧?Crystal Ball也許?然後,您將能夠根據需要生成儘可能多的「現實」的剩餘數據。

+0

謝謝@vivek,我正在使用sqldatagenerator,但它只爲列取空值。我對某種工具感興趣,它可以將我真實數據的列值或相關矩陣的概率考慮在內,並據此生成數據? – Mona

+0

執行統計分析以獲得模型(列概率或相關矩陣)是困難的部分。鑑於此,生成數據非常簡單;通常你會生成0到1之間的隨機值,並將它們插入到最終的模型中。 –

+0

我做了很難的部分。現在我想要一些免費工具,以我的列值百分比/概率並在此基礎上生成記錄。 – Mona

相關問題