我讀過香農理論的熵,以及如何實現這樣一個二進制文件的算法(很容易)二進制文件中的熵 - 目的是什麼?
但我不明白什麼是計算熵的一個.exe或任何二進制文件
我可以理解計算電信消息的熵(最壞的情況:每個符號具有相同的概率),但我無法獲得二進制文件的目的。
有人能解釋我這個嗎?
我讀過香農理論的熵,以及如何實現這樣一個二進制文件的算法(很容易)二進制文件中的熵 - 目的是什麼?
但我不明白什麼是計算熵的一個.exe或任何二進制文件
我可以理解計算電信消息的熵(最壞的情況:每個符號具有相同的概率),但我無法獲得二進制文件的目的。
有人能解釋我這個嗎?
假設一些信息或動態系統或分佈。熵是信息/系統/分佈中的無序度量。如果熵增長紊亂也會增長。如果熵是0,這意味着沒有障礙,分佈是不變的。
將所有這些應用到文件中,我可以假設,如果文件中的混亂是很高的文件很難壓縮。低熵文件(該文件中的大部分符號重合)被壓縮得更好。一般來說,我認爲低熵文件將更容易處理。
現在,應用程序計算二進制文件中的熵的大部分時間都與防病毒軟件相關。防病毒使用Entropy猜測文件是否被壓縮/解壓縮。通過了解熵級別,如果二進制文件被加密或者沒有加密,你也可以得到一個很好的主意。
我沒有想到這一點,謝謝你絕對是對的!無損算法,如簡單的RLE或LZW或霍夫曼編碼可以獲得同樣包裝算法的優勢 – 2011-06-06 19:04:36