2011-04-07 73 views
1

我正在嘗試構建一個博客映射網站,它可以查看給定博客集中的當前趨勢。爲了方便起見,我將重點介紹給定的WordPress博客列表。Python:解析wordpress HTML

是否有解析Wordpress HTML的Python包?

我在尋找:

  • 識別(是給定一個HTML WordPress的博客)
  • 博客屬性(名稱,職位,RSS鏈接,博客鏈接...)
  • 郵政屬性(標題,文字,標籤...)

如果沒有這樣的軟件包,我可以將它自己作爲開源項目來實現,但現有的軟件包會爲我節省大量時間。

+1

如果你寫自己的,看看[美麗的湯](http://www.crummy.com/software/BeautifulSoup/) – nmichaels 2011-04-07 21:13:50

+0

我建議lxml更現代 – Guard 2011-04-07 22:41:59

回答