在數據挖掘中，如何從大型數據集中提取最具代表性的子集？

-1

我有一個數據集有35萬行數據和23列，我想從中提取10000行和23列，這將最能代表父數據。在數據挖掘中，如何從大型數據集中提取最具代表性的子集？

*如何從大型數據集中提取最具代表性的子集*好吧，這是數據挖掘中最大的問題，更不用說它取決於許多事情，例如數據量有多大，有多少屬性列），什麼樣的數據..比如說..無論如何，你的問題是基於意見的，並且與一般的編程無關..對於國旗抱歉。 –

@BagusTesa此平臺僅適用於基於編程的問題嗎？我不這麼認爲。人們肯定可以要求做任務的方式。你的回答完全貶低。 –

好吧，這打破了[Stats StackExchange]（https://stats.stackexchange.com/）的目的。 –

您的問題的答案太籠統了。因爲你正在尋找最有代表性的一組，我建議一些東西

數據

2017-05-12 04:31:28

回答