2014-09-28 72 views
0

我有一個問題我試圖測試xhtml文檔中的搜索功能。搜索應該支持阿拉伯文和英文文本。我是python和libxml2的新手,所以我很難搞清楚如何去做。Python中的Unicode libxml2

儘管在線工具(如http://www.freeformatter.com/xpath-tester.html#ad-output)會返回我需要的確切結果,但我總是會得到一個帶有阿拉伯文字的空白結果(英文,它完美地起作用)。

import libxml2 

doc = libxml2.parseFile("content.xhtml") 

ctxt = doc.xpathNewContext() 

xPathQuery = "//*[contains(text(), 'تجربة')]" 

res = ctxt.xpathEval(xPathQuery) 

doc.freeDoc() 
ctxt.xpathFreeContext() 

也使用Unicode字符串沒有工作:

xPathQuery = u"//*[contains(text(), 'تجربة')]" 

甚至:

xPathQuery = u"//*[contains(text(), 'تجربة')]" 
res = ctxt.xpathEval(xPathQuery.encode('utf-8')) 
+0

雅我做了,我剛剛更新了問題。仍然不起作用,thanx :) – 2014-09-28 14:54:25

回答

0

它竟然是用代碼文件編碼本身的問題,我救了它在Unicode和它的工作。