Q

Data.Text中的解碼速度

2014-01-11 43 views 1 likes

1

在Haskell的Data.Text.Encoding中，假設其中一個呈現純粹的ASCII ByteString，是decodeLatin1比decodeUtf8快得多嗎？直觀地看起來至少有一個機器指令給出了utf-8的性質（即對最高位進行測試）。我知道我可以做我自己的分析，但我認爲這可能已經完成了，所以我問。Data.Text中的解碼速度

2014-01-11 Mike Menzel

+5

您是否真的願意在文本技術時間裏回溯四十年來節省一些機器指令？ –

+0

我只是好奇而已。 –

+1

UTF-8解碼器經常做的是他們使用位掩碼來檢查下一個例如8個字節沒有設置前導位。 – tibbe

A

回答

1

這是底層C代碼，文本庫在內部用於解碼器。具體功能_hs_text_decode_latin1：

http://hackage.haskell.org/package/text-1.0.0.1/src/cbits/cbits.c

是decodeLatin1比decodeUtf8
非常快很多

這個問題的答案很簡單，它不應該的問題，您應該選擇，如果使用的latin1解碼器您需要使用現有的latin1文本數據。對於幾乎所有情況，其他任何內容都只是微型優化，text庫已經非常嚴格優化。

2014-01-11 06:57:07

相關問題

1. 帶Data.Text的Text.Printf？
2. BitmapImage解碼速度性能wpf
3. 爲秒差距3.X Data.Text解析器
4. Data.Text與繩索
5. 解析$ user_agent的速度？
6. Microsoft.Data.Schema.ScriptDom解析器的速度
7. Python中「總和」理解的速度
8. AVD中的解析速度非常慢
9. 解碼迅速4
10. Data.Text VS字符串

11. 黃瓜解析速度
12. ASCII文件解析速度
13. Android HTML Jsoup解析速度
14. XML解析速度減慢
15. AES256加密/解密速度
16. jFugue錯誤解析速度
17. 速度問題與代碼
18. PHP速度測試代碼
19. 加速度計代碼
20. Java代碼速度提升
21. 速度在Java中，爲什麼有些代碼的運行速度
22. Data.Text是否有Functor實例？
23. 使用秒差距與Data.Text
24. 在Latin1編碼的Data.ByteString和Data.Text之間進行轉換
25. MPEG-4解碼器與MPEG 2解碼器與3GP解碼器相比，速度更快，爲什麼？
26. 速度中的JSONObject
27. 不能解釋速度的行爲
28. 速度與Bandwith，ISP的誤解？
29. 代碼中的過度屬性調用速度慢嗎？
30. 如何以速度速度優化此JAVA代碼？