2013-08-06 40 views
-1

如果我用pyquery打開一個html文件base_result.htm,它會返回[None],並在我搜索時引發錯誤。如果我使用同一個文件作爲字符串,一切運作良好。pyquery打開文件時返回[None]

>>> d = PyQuery(filename = 'base_result.html') 
>>> d 
[None] 
>>> f = open('base_result.html') 
>>> d = PyQuery(f.read()) 
>>> d 
[<html>] 
+0

你有問題嗎?這是記錄的行爲。 –

+0

這是記錄的行爲?我有兩個相同的文件,一個在線和一個本地文件,但解析'url ='和'filename ='是不同的。 – maged

+1

我站好了;我不明白爲什麼它會返回'None'(儘管如果解析爲'url ='和'filename ='的意思是相同的,它們不需要兩個單獨的關鍵字!)。但是,我不知道你是如何獲得無回報價值的。你確定你有最新版本嗎? –

回答

1

它的開放問題PyQuery:https://github.com/gawel/pyquery/issues/22

在上面的鏈接中提到的一些解決方法,如:

>>> from lxml.html import parse 
>>> parse("index.html") 
<lxml.etree._ElementTree object at 0x108a72f38> 
>>> pq(parse("index.html").getroot()) 

>>> f = open('index.html') 
>>> d = PyQuery(f.read())