2012-03-30 65 views
4

我是一名新生兒程序員,仍然在我的Alt + Tab上編寫書籍。我想創作的第一個節目之一是幫助我的媽媽工作。我需要知道我是否可以使用Python來創建它。可以使用Python完成網頁自動化嗎?

它需要:

  1. 去網上和登錄帳戶與/單程。

  2. 做具體條件進行搜索(使用該網站的搜索引擎)

  3. 查看所有結果,只挑那些最新的。

  4. 將它們排序。

  5. 通知我,以便在網站上發佈最新增加的內容。

從我看到的網站上說:.cgi到最後。

我知道python可以連接,從頁面下載文本和排序想要的信息,但它可以登錄,使用搜索引擎,並選擇我需要的選項?

我不想跳過我的學習過程,但我對這個項目非常認真,我已經準備好放下Python並開始學習一些可以做到的語言!

我將非常感謝您的指導! 謝謝你的時間!

AJ

+6

Python是一種通用的語言。是的,它可以做到這一點,或基本上是其他任何事情。 – agf 2012-03-30 14:48:19

+1

是的,你可以做到這一點。閱讀下面答案中鏈接的材料,並嘗試開始項目。使用谷歌搜索解決您的問題(有很多的python食譜,官方python.org文檔有豐富的信息),並尋找現有的答案在這裏符合你的問題。一旦你陷入困境,來到這裏,用一個清晰​​,簡潔和完整的例子來問一個具體的問題,包括你的代碼和有問題的輸入和輸出。祝你好運,快樂的編碼! – Marcin 2012-03-30 14:55:58

+0

您可能會從對網絡工作的基本理解中受益(閱讀關於HTTP,HTML和XHTML等)。此外,非常希望將他們的好答案投票的人,並且如果答案是針對您的問題的完整解決方案,那麼他們的答案就會被接受。 – Marcin 2012-03-30 15:14:48

回答

1

Python是一樣可以勝任這份任何其他語言,但你會想看看之類的東西httplib和理解餅乾和HTTP請求。所以是的,它可以。

這將成爲你最好的朋友:http://docs.python.org/

4

我想你應該看看的Mechanize項目。它是Python中的一個有狀態的瀏覽器,因此您可以輕鬆地提交表單和該類性質的事物並維護會話。然後,您需要使用lxml.htmlBeautifulSoup來檢查文檔(儘管機械化本身包含一些用於檢查文檔的工具)。

3

是的,它可以。具體而言,您需要使用諸如mechanize之類的東西來處理網絡驅動部分。

1

如果我理解的很好,你的程序的想法是做一個自動瀏覽會話。 所以是的,這是可能的。這在網站編程(cgi,php等)中並不重要。所有你需要的是通過post/get(像真正的瀏覽器)發送數據並處理返回(regexp等)。

好運

4

要添加到許多評論封裝的輝煌列表,你可以使用Selenium了。

1

我想指出,這取決於你是什麼網站,有可能會比從網頁刮數據和機械化/硒工作,做你想做的更有效的方法(可能是一個公開的Web服務)。如果你是在網絡上,瀏覽器驅動器工具是錘子,他們將獲得的木螺絲,但有時其他工具將更好地工作。

相關問題