如何去除KOI8-R編碼字符中的第8位以便爲俄文字母進行轉換?特別是如何在Python中做到這一點?如何去除KOI8-R編碼字符中的第8位?
1
A
回答
1
我不太確定你想要什麼,但如果你想零的第8位,它可以這樣做:
character = character & ~(1 << 7)
1
這裏有一種方法:
import array
mask = ~(1 << 7)
def convert(koistring):
bytes = array.array('B', koistring)
for i in range(len(bytes)):
bytes[i] &= mask
return bytes.tostring()
test = u'Русский Текст'.encode('koi8-r')
print convert(test) # rUSSKIJ tEKST
我不知道是否Python提供一個更清潔的方式做這樣的操作:)
2
假設S的是KOI8-R編碼字符串,你可以試試這個:
>>> s = u'Код Обмена Информацией, 8 бит'.encode('koi8-r')
>>> s
>>> '\xeb\xcf\xc4 \xef\xc2\xcd\xc5\xce\xc1 \xe9\xce\xc6\xcf\xd2\xcd\xc1\xc3\xc9\xc5\xca, 8 \xc2\xc9\xd4'
>>> print ''.join([chr(ord(c) & 0x7F) for c in s])
>>> kOD oBMENA iNFORMACIEJ, 8 BIT
第8位被剝去(ord(c) & 0x7F)
。
相關問題
- 1. MimeDecode koi8r字符集
- 2. 如何從UTF 8編碼的csv中刪除BOM(?)字符?
- 3. 去除特殊字符編碼
- 4. 刪除或編碼非UTF-8字符
- 5. 如何在8 * 8 DataMatrix中編碼3個以上的字符?
- 6. 如何在PHP中檢測並去除UTF-8字符
- 7. 如何編碼爲從WPF中的UTF-8字符串解碼?
- 8. 如何去除.htaccess中的字符串?
- 9. utf-8字符集,7位編碼,PHP添加奇怪字符
- 10. 如何從c中的字符串中去除html代碼#
- 11. UTF-8編碼字符集
- 12. PHP:UTF 8字符編碼
- 13. dompdf字符編碼UTF-8
- 14. Jquery UTF-8字符編碼
- 15. SQL中的UTF-8字符編碼
- 16. 如何從字符串中刪除HTML編碼的字符?
- 17. 如何在HTTPUI中處理SOAPUI中的UTF-8字符編碼
- 18. json_encode()從輸出中排除UTF-8編碼的字符串
- 19. 在UTF-8格式編碼字符串去
- 20. python將12位圖像編碼爲字符串到8位png
- 21. Perl如何去除字符串的第二行
- 22. .Net 8位編碼
- 23. PHPMailer編碼8位
- 24. 空字符解碼ASCII 8位編碼文件
- 25. 如何檢測Latin1編碼列中的UTF-8字符 - MySQL
- 26. 如何將字符集編碼爲JBoss 4中的UTF-8
- 27. 如何將字符串編碼更改爲utf 8中的C
- 28. 如何在python中左對齊UTF-8編碼的字符串?
- 29. 如何在C#中讀取utf-8編碼的字符串?
- 30. IE 8中文編碼字符
「x&= y」也被支持。 – Constantin 2009-06-15 07:06:22
僅當「字符」不是字符時,否則TypeError:不支持的操作數類型爲&:'str'和'int'。 「字符」必須是整數。 – mhawke 2009-06-15 07:18:42