結構如下考慮一個數據庫:[R尋找模式
<Age> <Gender> <Field1> <Field2> <Field3> <Field4> <Field#>
其中的每一行,一些領域可能爲零,另一些則不會,代表的時間從個體量使用這樣的字段 - 可以爲每一行使用多個字段。
例如,考慮DB的存在:
10 M 10 0 5 0 1
5 M 7 1 6 0 2
10 M 6 1 4 1 0
....
所以我們可以說,對於10歲和男性個體的模式,將是第一個和第三個領域是最具代表性的。
我不確定我的解釋是否有意義。這是可以實現的嗎?有這種問題的算法/ R包嗎?
豈不' Field1'和'Field3'是最常用的? – herbaman
是的,我會錯過它哈哈謝謝 – JDoe