Q

蟒蛇LXML找到<FB：評論/>標籤

python
lxml

2012-06-19 17 views 3 likes

3

我使用lxml的解析，有一個Facebook的評論標籤，看起來像在HTML：蟒蛇LXML找到<FB：評論/>標籤

<fb:comments id="fb_comments" href="http://example.com" num_posts="5" width="600"></fb:comments>

我想選擇它來獲得HREF值，但是當我做了cssselect('fb:comments')我得到以下錯誤：

The pseudo-class Symbol(u'comments', 3) is unknown

有沒有辦法做到這一點？

編輯： 代碼：

from lxml.html import fromstring 
html = '...' 
parser = fromstring(html) 
parser.cssselect('fb:comments') #raises the exception

2012-06-19 applechief

+0

請提供您的python代碼。 –

+0

@Secator代碼加入 – applechief

A

回答

3

的cssselect()方法解析使用給定CSS selector表達該文檔。在你的情況下，冒號（:）是一個與CSS僞類語法（即tagname:pseudo-class）混淆的XML命名空間前綴分隔符（即<namespace:tagname/>）。

根據lxml manual你應該爲了找到一個命名空間前綴（fb）標籤（comments）使用cssselect()namespace-prefix|element語法。所以：

from lxml.html import fromstring 
html = '...' 
parser = fromstring(html) 
parser.cssselect('fb|comments')

2012-06-19 14:30:50

+0

太棒了！謝謝，但這是返回'未定義名稱空間前綴'任何想法爲什麼？ – applechief

+1

也許只用'comments'（w/o命名空間）試試吧？ –

+0

是的！有效。謝謝:) – applechief

相關問題

1. FB評論無視Meta標籤
2. 如何使用BeautifulSoup查找評論標籤？
3. 與LXML蟒蛇
4. 什麼>><<並做蟒蛇
5. 存儲評論數據蟒蛇
6. Facebook的評論 - synching從博客評論 - > FB公司頁/牆
7. 在硒蟒蛇中查找標籤
8. 是否<include>評論標籤抑制intellisense？
9. 評論fb button，評分
10. Blogger Fb評論框

11. 特定FB-評論
12. 從fb導出評論：評論
13. 評論php標籤
14. 蟒蛇/ beautifulsoup找到所有<a href> with specific anchor text
15. FB評論與非FB評論混合在一起？
16. 找到<input>在Div標籤
17. 蟒蛇ID3標籤的Unicode
18. 蟒蛇HTML標籤提取
19. 蟒蛇BeautifulSoup搜索標籤
20. 標籤錯誤蟒蛇
21. 蟒蛇搜索標籤
22. Struts <s:if>標籤沒有評估
23. 搬到新的fb：評論，但舊的評論，即使migrated =「1」
24. 評估從蟒蛇
25. 蟒蛇：找到HTML標籤和替換它們的屬性
26. 新的FB評論出口到分區
27. 刷新Fb評論插件
28. FB api評論通知
29. FB評論框不工作
30. FB評論永不停止