2016-02-04 34 views
3

我有一個關於熵解釋的問題。對於我數據集中的每個人,我有一個長度爲17個字符(年)的字符串/序列。我特別感興趣的是在這個觀察期內發生了多少變化。解釋熵大小的經驗法則

我在考慮用R的TraMineR包來計算序列內熵。我知道這可以歸一化,所以最大熵變爲1(顯然,最小值爲0)。我的問題是,如果有什麼經驗法則可以說什麼是高熵和什麼是低熵(例如在相關係數的情況下)。例如,0.4是高還是低?

謝謝。

回答

1

序列內熵是強烈的上下文相關的。爲了確定一個特定序列的熵是高還是低,我建議比較它與其他序列的熵或與例如平均內熵的比較。

同樣,一組的平均序列內熵,將它與其他組的平均熵進行比較。因此,你可以得出結論,比如女性的職業熵高於男性。