我一直在試圖提取和刮取關於爲joda-time軟件提交的bug的信息。但是,我找不到使用自動化腳本或其他東西將此信息導出到文件的好方法。我在網上找到了一些python腳本,但主要是關於將sourceforge票據轉換爲git或過時的。Sourceforge導出XML或HTML
在這方面的任何幫助將不勝感激。
感謝, Shivani
我一直在試圖提取和刮取關於爲joda-time軟件提交的bug的信息。但是,我找不到使用自動化腳本或其他東西將此信息導出到文件的好方法。我在網上找到了一些python腳本,但主要是關於將sourceforge票據轉換爲git或過時的。Sourceforge導出XML或HTML
在這方面的任何幫助將不勝感激。
感謝, Shivani
您可以編寫使用BeautifulSoup刮腳本。通過使用BeautifulSoup編寫一些Python代碼,您可以從joda-time軟件的每個bug故障單頁面的HTML中提取必要的信息。這並不困難,然後你可以用提取的信息做你想要的。
對不起,我不明白你的問題。 如果你的問題是如何提取一個文件作爲HTML,並保存爲一個HTML
您可以使用的urllib:http://docs.python.org/library/urllib.html
如果您是項目管理員,你有一個export to xml選項。