2013-05-16 64 views
0

因此,我一直在四處搜尋,試圖找出如何提取某些特定數據(如文本),並將該數據推送到組織數據的程序中。需要從網站提取數據並推送到程序

因此,如果您以homedepot.com爲例,想要從「2x4 wood」下列出的每個項目中提取出來,並且需要從每個項目中提取名稱,描述和規格,並將該數據導入到包含這些數據的一塊軟件?

所以我想這會像自動數據輸入?

從我研究的內容中,我需要編寫一個搜索器程序,該程序旨在搜索特定的術語,然後抓取結果返回的每個頁面,並獲取我需要的數據。

但是我有一個問題:我不知道任何編程/腳本,並且不確定從哪裏開始。我找到了一種基於Python的Scrapy。這是我想用於抓取工具嗎?

我遇到的下一個問題是,我不知道如何將收集的數據導入到軟件中。任何提示,我應該看看這個答案?

我想用這個想法,我必須幫助我學習如何腳本。

+0

您對本網站的問題太廣泛。您需要通過閱讀文檔,書籍或教程來學習編程。如果您有關於您編寫​​的代碼的具體問題,請隨時發佈。 –

回答

0

那麼你或許應該通過學習一般的語言,將使它容易得多做

開始,但對於Web的東西,你可以使用一種叫做urllib而urllib2的這些都可以打開瀏覽器來獲取數據實際上不打開窗戶

也有一些自動化的Web瀏覽器,如它實際上打開的窗口中硒

還有很多其他的,你可以通過看在互聯網上

但這只是網絡瀏覽器自動化,那麼你必須實際獲得你想要的信息和數據,因爲你需要類似scrapy的東西,就像你說的那樣,或者通過源代碼挑選出你想要的信息

since我並不確切地知道你想要的那種難以解釋什麼,但我希望這給你的地方開始

但是就像我說你應該瞭解基本的蟒蛇,這將有助於很多

我希望這幫助!

+0

感謝您的迴應。是完美的答案。你會在哪裏說學習python的最佳位置? 我知道pythons網站有一個電子書,但不知道這對於noobs好嗎? – Jordan

+0

好個人書籍讓我感到厭倦,但他們確實幫助「潛入蟒蛇」和「學習python的艱辛之路」,我聽說它們都很好。 YouTube上還有大量視頻教程。如果你更喜歡學習檢查http://www.codecademy.com/tracks/python Python在主好運中相對容易學習! – Serial

0

另一種選擇是Beautiful Soup。 Python是一種快速學習的語言,專注於可讀性和簡單性。有大量的資源可以在線學習python。我建議Learn Python the Hard Way。不要因名字而感到灰心,它是信息豐富的,並側重於傳統的語言學習方法,這些方法的效果令人驚訝。