2011-04-11 37 views
0

我正在用python做一些網頁抓取的東西。但正如你所知,一些網頁有不同的字符集。我需要獲得這些網頁字符集。所以長話短說,對於lxml,什麼是xpath模式?使用xpath獲取(X)HTML文檔中元元素的字符集屬性

謝謝。

+0

你問如何獲得一個'meta'元素的'content'屬性的值? – 2011-04-11 01:03:21

+0

是的。這就是我正在尋找的。 – wonnie 2011-04-11 01:19:12

+0

好的,那麼。回答。 – 2011-04-11 01:23:41

回答

2

此:

/html/head/meta[@http-equiv='Content-Type']/@content 

HTML5:

/html/head/meta/@charset