2012-07-08 30 views
1

我一直在試圖提取和刮取關於爲joda-time軟件提交的bug的信息。但是,我找不到使用自動化腳本或其他東西將此信息導出到文件的好方法。我在網上找到了一些python腳本,但主要是關於將sourceforge票據轉換爲git或過時的。Sourceforge導出XML或HTML

在這方面的任何幫助將不勝感激。

感謝, Shivani

回答

0

您可以編寫使用BeautifulSoup刮腳本。通過使用BeautifulSoup編寫一些Python代碼,您可以從joda-time軟件的每個bug故障單頁面的HTML中提取必要的信息。這並不困難,然後你可以用提取的信息做你想要的。