2010-11-18 130 views
1

我有一堆包含以下面的格式數據的二進制文件:轉換二進制文件轉換成ASCII在Python

i\xffhh\xffhh\xffhh\xffih\xffhh\xffhh\xffhh\xffhh\xffhi\xffii\xffjj\xffjj\xffjj\xffjk\xffkk\xffkk\xffkl\xffll\xffmm\xffmn\xffnn\xffon\xffno\xffop\xffop\xffpp\xffqq\xffrq\xffrs\xffst\xfftt\xfftt\xffuv\xffvu\xffuv\xffvv\xffvw\xffwx\xffwx\xffxy\xffyy\xffyz\xffz{\xffz{\xff||\xff}|\xff~}\xff}}\xff~~\xff~~\xff~\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x80\x80\xff\x80\x81\xff\x81\x80\xff\x81\x81\xff\x81\x82\xff\x82\x82\xff\x82\x82\xff\x82\x83\xff\x83\x83\xff\x83\x83\xff\x83\x84\xff\x83\x84\xff\x84\x85\xff\x85\x85\xff\x86\x85\xff\x86\x87\xff\x87\x87\xff\x87\x87\xff\x88\x87\xff\x88\x89\xff\x88\x89\xff\x89\x8a\xff\x89\x8a\xff\x8a\x8b\xff\x8b\x8b\xff\x8b\x8c\xff\x8d\x8d\xff\x8d\x8d\xff\x8e\x8e\xff\x8e\x8f\xff\x8f\x8f

這些都應該是從當一個人正在行走壓力傳感器讀數,所以我假設他們是數字,但我想將它們轉換爲ASCII,所以我有一些想法是什麼。我如何轉換它們?他們目前使用什麼格式?

編輯:鏈接到文件在這裏(Link

+1

這很有趣,因爲它們似乎開始在第一個\ x7f上有意義。我的猜測是你正在用一個編輯器來查看它,這個編輯器將一些二進制轉換成十六進制範圍之外的字符(例如,波浪號不是十六進制字符)。您能否向我們展示從實際的十六進制編輯器轉儲的文件,鏈接到該文件,或找出文件格式,但查看您正在使用的設備的文檔? – marr75 2010-11-18 19:39:44

+0

可能每個採樣3個字節,中間字節由於某種原因總是255。數據來自哪個設備? – 2010-11-18 19:41:00

+0

太棒了!我遇到這個問題是因爲我想破解FootWork壓力傳感器的校準文件('.cal3')。小世界! – heltonbiker 2011-08-09 15:05:25

回答

4

提供您不能只是打開一個二進制文件猜格式。您必須獲取有關特定壓力傳感器讀數的數據存儲方式的信息。

當然,當你知道格式,很容易讀取二進制模式的文件,然後從它

FILE = open(filename,"rb") 
FILE.read(numBytes) 
+1

...以及讀取後解碼數據,您可以使用結構模塊:http://docs.python.org/library/struct.html – che 2010-11-18 19:38:35

+1

這是一個答案?你會得到45個Zorkmids? – 2010-12-16 04:14:51

+0

我得到一個錯誤numBytes未定義 – Vincent 2013-10-22 05:56:26

0

第一部分看起來很奇怪得到所有的有意義的數據。通常情況下,像\ x8e這樣的數字只是一個用十六進制表示的字節的代碼,除非在第一部分中有像hh這樣的字母,它不應該是十六進制數字的一部分。

但你可以做這樣的事情第二部分:

hex_list = r"\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x80\x80\xff\x80\x81\xff\x81\x80\xff\x81\x81\xff\x81\x82\xff\x82\x82\xff\x82\x82\xff\x82\x83\xff\x83\x83\xff\x83\x83\xff\x83\x84\xff\x83\x84\xff\x84\x85\xff\x85\x85\xff\x86\x85\xff\x86\x87\xff\x87\x87\xff\x87\x87\xff\x88\x87\xff\x88\x89\xff\x88\x89\xff\x89\x8a\xff\x89\x8a\xff\x8a\x8b\xff\x8b\x8b\xff\x8b\x8c\xff\x8d\x8d\xff\x8d\x8d\xff\x8e\x8e\xff\x8e\x8f\xff\x8f\x8f" 
int_list = [int(hex,16) for hex in hex_list.replace('\\', ';0').split(';') if hex != ''] 

注意你總能獲得127和143之間的數字,除了255(在\ XFF)。

3

我絕對震驚和震驚,並沒有像所有的華夫餅一樣驚訝,如「你有像這樣的字母,不應該是一個十六進制數字的一部分」,「他們似乎開始正確的第一個\ x7f「。有沒有人看到任何repr()輸出?

下面顯示瞭如何可能已經結束了一樣的是,忽略這似乎只是噪音\xff

>>> pressure = [120,121,122,123,124,125,126,127,128,129,130,131] 
>>> import struct 
>>> some_bytes = struct.pack("12B", *pressure) 
>>> print repr(some_bytes) 
'xyz{|}~\x7f\x80\x81\x82\x83' 
>>> 

所以讓我們嘗試從文件工作回:

>>> guff = open('your_file.bin', 'rb').read() 
>>> cleaned = guff.replace("\xff", "") 
>>> cleaned 
'ihhhhhhihhhhhhhhhhiiijjjjjjjkkkkkklllmmmnnnonnoopopppqqrqrsstttttuvvuuvvvvwwxwx 
xyyyyzz{z{||}|~}}}~~~~~\x7f\x7f\x7f\x7f\x7f\x7f\x7f\x80\x80\x80\x81\x81\x80\x81\ 
x81\x81\x82\x82\x82\x82\x82\x82\x83\x83\x83\x83\x83\x83\x84\x83\x84\x84\x85\x85\ 
x85\x86\x85\x86\x87\x87\x87\x87\x87\x88\x87\x88\x89\x88\x89\x89\x8a\x89\x8a\x8a\ 
x8b\x8b\x8b\x8b\x8c\x8d\x8d\x8d\x8d\x8e\x8e\x8e\x8f\x8f\x8f' 
# Note that lines wrap at column 80 in a Windows "Command Prompt" window ... 
>>> pressure = [ord(c) for c in cleaned] 
>>> pressure 
[105, 104, 104, 104, 104, 104, 104, 105, 104, 104, 104, 104, 104, 104, 104, 104, 
104, 104, 105, 105, 105, 106, 106, 106, 106, 106, 106, 106, 107, 107, 107, 107, 
107, 107, 108, 108, 108, 109, 109, 109, 110, 110, 110, 111, 110, 110, 111, 111, 
112, 111, 112, 112, 112, 113, 113, 114, 113, 114, 115, 115, 116, 116, 116, 116, 
116, 117, 118, 118, 117, 117, 118, 118, 118, 118, 119, 119, 120, 119, 120, 120, 
121, 121, 121, 121, 122, 122, 123, 122, 123, 124, 124, 125, 124, 126, 125, 125, 
125, 126, 126, 126, 126, 126, 127, 127, 127, 127, 127, 127, 127, 128, 128, 128, 
129, 129, 128, 129, 129, 129, 130, 130, 130, 130, 130, 130, 131, 131, 131, 131, 
131, 131, 132, 131, 132, 132, 133, 133, 133, 134, 133, 134, 135, 135, 135, 135, 
135, 136, 135, 136, 137, 136, 137, 137, 138, 137, 138, 138, 139, 139, 139, 139, 
140, 141, 141, 141, 141, 142, 142, 142, 143, 143, 143] 
>>> 

你我們仍然需要閱讀設備的文檔以找出多大的0-254值的比例因子。

您會注意到,每次導出的數字都改變了+1,0或-1。這符合一個假設,即每個讀數只有1個字節,而不是每個讀數兩個或更多個字節。

另一個想法:或許\xff是一個開始或結束哨兵,並且每個週期有兩個值(開始,停止)或(傳感器-A,傳感器-B)被報告。

相關問題