使用xpath獲取（X）HTML文檔中元元素的字符集屬性

我正在用python做一些網頁抓取的東西。但正如你所知，一些網頁有不同的字符集。我需要獲得這些網頁字符集。所以長話短說，對於lxml，什麼是xpath模式？使用xpath獲取（X）HTML文檔中元元素的字符集屬性

謝謝。

2011-04-11 wonnie

你問如何獲得一個'meta'元素的'content'屬性的值？ – 2011-04-11 01:03:21

是的。這就是我正在尋找的。 – wonnie 2011-04-11 01:19:12

好的，那麼。回答。 – 2011-04-11 01:23:41

此：

/html/head/meta[@http-equiv='Content-Type']/@content

HTML5：

/html/head/meta/@charset

2011-04-11 01:21:43

回答