我正在評估算法,並且想使用人造數據。分類數據的人工數據集生成器
對於一維人工數據集,該算法工作正常,如this StackOverflow answer所示。
我想測試具有多維和某些特徵(例如噪聲,相關性)的數據集的算法。有人已經在R中實現了「人造數據集生成器」嗎?
任何反饋將非常感激。謝謝!
我正在評估算法,並且想使用人造數據。分類數據的人工數據集生成器
對於一維人工數據集,該算法工作正常,如this StackOverflow answer所示。
我想測試具有多維和某些特徵(例如噪聲,相關性)的數據集的算法。有人已經在R中實現了「人造數據集生成器」嗎?
任何反饋將非常感激。謝謝!
您可以使用wakefield包生成隨機數據集。
它可以輕鬆地創建數據幀,時間序列,調整相關的,甚至是可視化生成的數據,例如:
if (!require("pacman")) install.packages("pacman")
pacman::p_load_gh("trinker/wakefield")
pacman::p_load(dplyr, tidyr, ggplot2)
set.seed(10)
r_data_frame(n=100,
id,
dob,
animal,
grade, grade,
death,
dummy,
grade_letter,
gender,
paragraph,
sentence
) %>%
r_na() %>%
plot(palette = "Set1")
沒有生成它的實際代碼,該圖片是沒有用的。我建議你添加相關信息,否則這將進入非常低質量的答案隊列 –
會做。但這意味着要複製作者手冊中的代碼。 – epo3
您可以創建你想要的任何性質的人工數據集。如果你更具體地瞭解你想要的屬性,你會得到更好的答案。 –
你是指'MASS :: mvnorm'之類的東西? –
@羅曼謝謝,這將是一個開始,我猜。 – cs0815