我嘗試在Python拆分這種線:如何在Python中分割多語言行並獲取Unicode十六進制值?
aiburenshi 愛不忍釋 "לא מסוגל להינתק, לא יכול להיפרד מדבר מרוב חיבתו אליו"
此行包含希伯來文,簡體中國和英語。
如果我有例如一個元組T,我想獲得的元組是T =(希伯來文字符串,英文字符串,中國字符串)。
的問題是,我不知道如何讓希伯來字母的中國的Unicode值。這兩行不工作:
print ((unicode("釋","utf-8")).encode("utf-8"))
print ((unicode("א","utf-8")).encode("utf-8"))
而且我得到這個錯誤:
SyntaxError: Non-ASCII character '\xe9' in file split_or.py on line 9, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
這可能是值得說明您正在使用(x或3 x)的Python的版本無論是在問題中,標籤或兩者兼而有之。 – 2012-01-06 09:44:01
你有沒有在你的文件的開頭聲明任何編碼,如#coding:UTF-8? – 2012-01-06 10:46:26
你的國家的問題是一個非常明確的埃羅,即使包含的鏈接,告訴你如何解決這個問題的文本。你爲什麼不讀鏈接?因此,這是[在Python源代碼中使用utf-8編碼]的副本(http://stackoverflow.com/questions/6289474/working-with-utf-8-encoding-in-python-source) – 2013-05-04 16:25:52