mechanize

    0熱度

    1回答

    import mechanize br = mechanize.Browser() br.open('someurl.com') br.select_form(nr=0) br.form['user'] = 'myname' br.form['pw'] ='pw' req=br.submit() 後提交後,我登錄了新的一頁,這進一步要求我點擊「下一步」 <input type="s

    -1熱度

    1回答

    我有這段代碼,它給了我任何谷歌搜索條目的搜索結果的標題。不過我想鏈接「href」標籤標籤。示例代碼是需要 <h3 class="r"><a href="https://www.lonelyplanet.com/india" onmousedown="return rwt(this,'','','','1','AFQjCNG5Z2TycA5Rni1X_vKY3Gt9BEVS4w','','0ahUK

    3熱度

    1回答

    剛剛開始網頁抓取python,我正面臨一些問題。 我開始使用Selenium下載網頁的源代碼,並將其保存: from selenium import webdriver driver= webdriver.Firefox() driver.get("https://www.website.com") f=open('output.txt','w') f.write(driver.page_

    0熱度

    1回答

    機械化在此頁面上找不到表單。所以我試圖通過輸入來填寫。問題在於表單是Google自動填充。首先,我需要填寫輸入內容,然後從下拉菜單中選擇一個城市。因此,我曾嘗試是這樣的: ​​ 並獲得: NoMethodError: private method `select' called for nil:NilClass 附:首先我沒有找到AirBnB API。所以我潛心於機械化。如果有一個AirBnB

    0熱度

    1回答

    我試圖填寫的表格中有一個文本框和發送按鈕的HTML看起來像這樣 <form class="form-horizontal"> <div class="row"> <div class="col-md-12"> <div id="TextContainer" class="textarea-container">

    0熱度

    1回答

    試圖使用urllib2,機械化和BeautifulSoup刮這個網站url。當通過瀏覽器呈現並使用FireBug進行查看時,我們可以看到帶有類progress__supporters和progress_goal的div標籤,如下所示。 但是,當我們使用urllib2.open/mechanize/selenium查看網頁,這些標籤都沒有。以下是示例代碼 def parse_petition(sel

    0熱度

    1回答

    我寫一個劇本,我的僱主從他們自己的網站獲得某些數據。由於一長串原因,我需要從網站上獲取數據。我發現,有些數據是通過js調用來檢索的... 回想起來,我應該去機械化,但我去斜紋(想我會有機會接觸,因爲斜紋自我描述爲用於機械化的薄包裝)該項目只是一個完成後的電話,我絕對不想重寫所有基於斜紋的機械化代碼。 我需要提交未附加到表單POST請求。所以我需要機械化(或類似的lib)。據斜紋的文檔,應該有一個機

    0熱度

    1回答

    我使用機械化(http://wwwsearch.sourceforge.net/mechanize/)登錄到www.coinotron.com,但執行掛起,當我做br.submit() import mechanize ... br = mechanize.Browser() br.open("https://coinotron.com/app?action=logon") form =

    0熱度

    1回答

    我有一個網站,需要登錄(身份驗證),有一個消息頁面,我想將所有評論轉換爲PDF格式。最初,我只是點擊每一條評論,並選擇在Firefox瀏覽器打印,並將評論流保存爲PDF。問題是有這麼多,所以我決定寫一個Python腳本,但我有問題。這裏是我的代碼: import mechanize import pdfkit import os br = mechanize.Browser() br.s

    0熱度

    1回答

    我想刮網站的所有搜索結果頁,它的工作原理,但有時腳本將停止,並顯示以下錯誤: 502 => Net::HTTPBadGateway for https://website.com/id/12/ -- unhandled response (Mechanize::ResponseCodeError) 我想繼續即使它找到腳本一個錯誤。 我的腳本: require 'mechanize' requ