2016-08-04 158 views
3

我正在挖掘一些包含(除其他外)文本的舊二進制文件。他們的文本經常使用自定義字符編碼作爲原因,我希望能夠讀取和重寫它們。如何正確創建自定義文本編解碼器?

在我看來,這樣做的適當方法是使用standard codecs library創建自定義編解碼器。不幸的是,它的文檔既龐大又完全沒有例子。谷歌變成了幾個,但只爲python2,我用3.

我正在尋找一個如何使用編解碼器庫來實現自定義字符編碼的最小例子。

+0

不是最小的,但這可能是一個很好的開始:https://github.com/pyserial/pyserial/blob/master/serial/tools/hexlify_codec.py – krs013

回答

0

儘管在線文檔當然很少,但您可以通過查看the source code獲取更多信息。文檔和註釋非常清晰,並且父類(編解碼器,增量編碼器等)的定義已準備好複製/粘貼到您的編解碼器的開始處(請確保將每個類定義中的object替換爲名稱你繼承的類)。同樣值得一看的是我在鏈接到的example關於如何組裝/註冊它的評論。

我一直堅持在同一點,你一會兒看這個,所以祝你好運!如果我有幾天的時間,我會在這裏看到實際製作這個實現並粘貼/鏈接到它。

相關問題