我正在撰寫一篇關於人口普查局的population projections到2060的文章,其中包含一個3.3 MB .csv文件,其中包含未壓縮的文件。計算理論文本文件的大小
該文件包含539,781個值,每個值爲5-7個數字,佔用3,455,372個字符。當我gzip文件時,它下降到1550063字節,或1.47 MB。
我希望能夠如實說明它適合3.5英寸軟盤,最大容量爲1.44 MB。這只是一個參考點,而不是建議用戶需要如何操作的指導。
有沒有辦法根據上面的字符數來計算文本文件的理論大小?如果我們實際上有一個3.5英寸軟盤和一個驅動器,是否可以將這個文件放在磁盤上而不會丟失信息?謝謝!
這將是可能的(甚至很容易,即使是自動的)來計算熵。儘管如此,還是需要檢查文件的全部內容。 (如果我們知道值的範圍,可以進行高估:最小值和最大值是多少?) – delnan
最小值爲0,最大值爲420267733 這裏計算得出 https://gist.github.com/4287201 –