screen-scraping

    0熱度

    1回答

    我想從這個網站刮交換價格信息,並採取後入數據庫:https://www.mnb.hu/arfolyamok 我寫了這個代碼,但蹊蹺的吧。我如何解決它,我必須改變它? 我與Python 2.7.13在Windows 7 的代碼工作是在這裏: import csv import requests from BeautifulSoup import BeautifulSoup u

    0熱度

    1回答

    我目前正在嘗試在PowerShell中開發一個用於打開Internet Explorer,更改兩個下拉值(更新表值)的腳本,然後將表格最好拖放到CSV文件中。 順便說一句,該網站有一個靜態的URL,改變下拉不改變網址:( 我可以得到IE打開和改變兩個下拉值,但該表不是在此之後更新自己的價值觀...... 我認爲這是值得做的網站代碼,它顯示了這個下拉菜單的選項: <select id="pricin

    0熱度

    1回答

    我得到當我打電話一個錯誤:其被定義爲Datascrape(): Sub Datascrape() Dim count, i As Long Dim ie As Object count = Sheets("properties-2017-06-05").Cells(1, 10).Value Sheets("properties-2017-06-05").Ra

    0熱度

    1回答

    建立 我與scrapy刮房屋廣告的UL部分。 我成功收集每個廣告的大部分住房特徵,隨後用大熊貓進行分析。 問題 我似乎無法湊了一定ul廣告頁面。這個問題涉及任何房屋廣告頁面上的「主要功能」和「額外」部分:例如this one。 當我嘗試刮擦元素時,我收到一個空白返回。 嘗試次數 我試過以下,以獲得 '附加' response.css("section.divFeatures") # empty

    0熱度

    2回答

    如何從具有下表數據的html頁面提取日期「June 03,2017」。日期將根據訂單號更改。我不確定我是否正確使用它。請指教。 <tr> <td style="font:bold 24px Arial;">Order #12345</td> <td style="font:13px Arial;"><strong>Order Date:</strong> June 03, 20

    0熱度

    1回答

    我爲我的應用程序使用Windows「問題步驟記錄器」(PSR),並需要將每個ActionSet(截圖)與時間戳一起存儲爲滴答粒度粒度。目前PSR HTML文件給我按以下格式每一個動作: <EachAction ActionNumber="120" Time="11:43:44 AM" Pid="8992" ProgramId="0000da39a3ee5e6b4b0d3255bfef9560189

    0熱度

    1回答

    因此我對此很陌生,在這個問題上,我一直沒能在google上找到任何東西。 我使用要求和LXML與的Python,我已經看到有很多關於網頁抓取不同的模塊,但沒有任何理由在選擇一個另一個?你可以使用request/lxml來做同樣的事情嗎?例如BeautifulSoup? 無論如何,這裏是我的實際的問題; 這是我的代碼: import requests from lxml import html

    1熱度

    1回答

    這是我的代碼。我正在嘗試打印商業名稱並且它的工作原理 但打印商業地址時始終爲空值。 from lxml import html import requests from bs4 import BeautifulSoup page = requests.get('https://appext20.dos.ny.gov/lcns_public/bus_name_inq_frm?p_reco

    0熱度

    1回答

    當我刮的網頁https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要從表中數據的標題。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = requ

    0熱度

    1回答

    我刮的網頁https://www.g2a.com/rising-storm-2-vietnam-steam-cd-key-global.html 我需要從表中數據的標題。 var express = require('express'); var fs = require('fs'); var request = require('request'); var cheerio = requi