在我們的一個項目中,我們使用Kafka和AVRO在應用程序之間傳輸數據。數據被添加到AVRO對象,並且對象被二進制編碼以寫入Kafka。我們使用二進制編碼,因爲它與其他格式相比通常被稱爲最小表示。AVRO壓縮數據的二進制編碼?
的數據通常是一個JSON字符串,當它被保存在一個文件,它使用到磁盤上的10 MB。但是,當文件被壓縮(.zip)時,它只使用幾個KB。我們關心的是將這些數據存儲在Kafka中,所以在寫入Kafka話題之前試圖壓縮。
當被測量的二進制編碼消息(即字節數組的長度)的長度,它正比於數據串的長度。所以我認爲二進制編碼不會縮小任何尺寸。
有人可以告訴我,如果二進制編碼壓縮數據?如果不是,我該如何應用壓縮?
謝謝!