當我在BeautifulSoup中使用unicode
函數時 - 它從哪個編碼轉換爲Unicode?它會自動使用soup.originalEncoding
嗎?BeautifulSoup中的unicode函數從哪個編碼轉換而來?
from BeautifulSoup import BeautifulSoup
doc = "<html><h1>Heading</h1><p>Text"
soup = BeautifulSoup(doc)
print unicode(soup)
感謝
類型可以通過實現特殊['__unicode__()'](http://docs.python.org/reference/datamodel.html#object.__unicode__)方法來覆蓋'unicode()'。如果一個類型實現了這個方法,''unicode()'builtin只是返回這個方法的結果,而一個類型基本上可以從這個方法返回任何想要的結果。所以OP中調用的結果實際上取決於'BeautifulSoup'類的實現。 – lunaryorn 2010-07-07 07:35:51
好點。有誰知道BeautifulSoup是否會覆蓋內置函數? – 2010-07-07 07:55:07