Python中的Unicode libxml2

我有一個問題我試圖測試xhtml文檔中的搜索功能。搜索應該支持阿拉伯文和英文文本。我是python和libxml2的新手，所以我很難搞清楚如何去做。Python中的Unicode libxml2

儘管在線工具（如http://www.freeformatter.com/xpath-tester.html#ad-output）會返回我需要的確切結果，但我總是會得到一個帶有阿拉伯文字的空白結果（英文，它完美地起作用）。

import libxml2 

doc = libxml2.parseFile("content.xhtml") 

ctxt = doc.xpathNewContext() 

xPathQuery = "//*[contains(text(), 'تجربة')]" 

res = ctxt.xpathEval(xPathQuery) 

doc.freeDoc() 
ctxt.xpathFreeContext()

也使用Unicode字符串沒有工作：

xPathQuery = u"//*[contains(text(), 'تجربة')]"

甚至：

xPathQuery = u"//*[contains(text(), 'تجربة')]" 
res = ctxt.xpathEval(xPathQuery.encode('utf-8'))

來源

2014-09-28 Tamim Al Manaseer

雅我做了，我剛剛更新了問題。仍然不起作用，thanx :) – 2014-09-28 14:54:25

它竟然是用代碼文件編碼本身的問題，我救了它在Unicode和它的工作。

來源

2014-11-05 08:17:19

Python中的Unicode libxml2

回答

相關問題