mechanize

0熱度

1回答

import mechanize br = mechanize.Browser() br.open('someurl.com') br.select_form(nr=0) br.form['user'] = 'myname' br.form['pw'] ='pw' req=br.submit() 後提交後，我登錄了新的一頁，這進一步要求我點擊「下一步」 <input type="s

-1熱度

1回答

從谷歌搜索結果中獲取鏈接

我有這段代碼，它給了我任何谷歌搜索條目的搜索結果的標題。不過我想鏈接「href」標籤標籤。示例代碼是需要 <h3 class="r"><a href="https://www.lonelyplanet.com/india" onmousedown="return rwt(this,'','','','1','AFQjCNG5Z2TycA5Rni1X_vKY3Gt9BEVS4w','','0ahUK

3熱度

1回答

BeautifulSoup和lxml找不到div元素

剛剛開始網頁抓取python，我正面臨一些問題。我開始使用Selenium下載網頁的源代碼，並將其保存： from selenium import webdriver driver= webdriver.Firefox() driver.get("https://www.website.com") f=open('output.txt','w') f.write(driver.page_

0熱度

1回答

使用google自動完成機械化

機械化在此頁面上找不到表單。所以我試圖通過輸入來填寫。問題在於表單是Google自動填充。首先，我需要填寫輸入內容，然後從下拉菜單中選擇一個城市。因此，我曾嘗試是這樣的：並獲得： NoMethodError: private method `select' called for nil:NilClass 附：首先我沒有找到AirBnB API。所以我潛心於機械化。如果有一個AirBnB

0熱度

1回答

蟒蛇自動填寫表單

我試圖填寫的表格中有一個文本框和發送按鈕的HTML看起來像這樣 <form class="form-horizontal"> <div class="row"> <div class="col-md-12"> <div id="TextContainer" class="textarea-container">

0熱度

1回答

使用python和BeautifulSoup刮掉不完整的標籤

試圖使用urllib2，機械化和BeautifulSoup刮這個網站url。當通過瀏覽器呈現並使用FireBug進行查看時，我們可以看到帶有類progress__supporters和progress_goal的div標籤，如下所示。但是，當我們使用urllib2.open/mechanize/selenium查看網頁，這些標籤都沒有。以下是示例代碼 def parse_petition(sel

0熱度

1回答

獲取機械化和斜紋說話

我寫一個劇本，我的僱主從他們自己的網站獲得某些數據。由於一長串原因，我需要從網站上獲取數據。我發現，有些數據是通過js調用來檢索的... 回想起來，我應該去機械化，但我去斜紋（想我會有機會接觸，因爲斜紋自我描述爲用於機械化的薄包裝）該項目只是一個完成後的電話，我絕對不想重寫所有基於斜紋的機械化代碼。我需要提交未附加到表單POST請求。所以我需要機械化（或類似的lib）。據斜紋的文檔，應該有一個機

0熱度

1回答

蟒蛇機械化 - 不能提交登錄表單

我使用機械化（http://wwwsearch.sourceforge.net/mechanize/）登錄到www.coinotron.com，但執行掛起，當我做br.submit() import mechanize ... br = mechanize.Browser() br.open("https://coinotron.com/app?action=logon") form =

0熱度

1回答

如何將網頁轉換爲PDF格式，如PDF格式保存爲PDF格式打印

我有一個網站，需要登錄（身份驗證），有一個消息頁面，我想將所有評論轉換爲PDF格式。最初，我只是點擊每一條評論，並選擇在Firefox瀏覽器打印，並將評論流保存爲PDF。問題是有這麼多，所以我決定寫一個Python腳本，但我有問題。這裏是我的代碼： import mechanize import pdfkit import os br = mechanize.Browser() br.s

0熱度

1回答

紅寶石機械化刮ResponseCodeError

我想刮網站的所有搜索結果頁，它的工作原理，但有時腳本將停止，並顯示以下錯誤： 502 => Net::HTTPBadGateway for https://website.com/id/12/ -- unhandled response (Mechanize::ResponseCodeError) 我想繼續即使它找到腳本一個錯誤。我的腳本： require 'mechanize' requ