我已經閱讀了很多相關的問題,並且對於如何處理這種情況有點不確定。在python,龍捲風和redis上運行的網站上處理外來字符
基本問題:在網站中處理「外國人」(希伯來語,希臘語,阿拉米語?等)字符的最佳方法是什麼?
我知道我需要使用UTF-8編碼,但它背後的機制卻在我身上丟失了。
我使用龍捲風作爲我的框架,並將數據存儲在redis中。
我目前的實現是簡單地將英文鍵盤等價物存儲在數據存儲中,然後用適當的希伯來語/希臘字體(例如Bwhebb.ttf)在頁面上呈現。這在大多數情況下都有效,但是我正在碰撞一些正在進行CGI編碼的字符,這反過來導致字體方法被破壞。
http://farmdev.com/talks/unicode/ –
http://www.joelonsoftware.com/printerFriendly/articles/Unicode.html - 這篇文章的標題是「絕對最低限度的每個軟件開發人員,絕對肯定,肯定必須知道的關於Unicode和字符集「 - 請去閱讀它(沒有藉口!):它是寫得很好,我相信這將是有益的給你。 –
另一個良好的閱讀,專門針對蟒蛇3是http://diveintopython3.org/strings.html(上joelonsoftware文章是一個很好的閱讀,但你可以看到它已經差不多10年前寫的) – mac