1
我正在嘗試構建一個博客映射網站,它可以查看給定博客集中的當前趨勢。爲了方便起見,我將重點介紹給定的WordPress博客列表。Python:解析wordpress HTML
是否有解析Wordpress HTML的Python包?
我在尋找:
- 識別(是給定一個HTML WordPress的博客)
- 博客屬性(名稱,職位,RSS鏈接,博客鏈接...)
- 郵政屬性(標題,文字,標籤...)
如果沒有這樣的軟件包,我可以將它自己作爲開源項目來實現,但現有的軟件包會爲我節省大量時間。
如果你寫自己的,看看[美麗的湯](http://www.crummy.com/software/BeautifulSoup/) – nmichaels 2011-04-07 21:13:50
我建議lxml更現代 – Guard 2011-04-07 22:41:59