screen-scraping

    0熱度

    3回答

    我對Python相當陌生,但我想知道是否可以利用Python及其模塊。要從頁面1中檢索href,然後在頁面2中檢索第一個段落。 Q2:另外,如何在頁面1上使用相同的div類刮掉前10個鏈接hrefs,然後刮掉前10個段落,而循環?

    0熱度

    2回答

    我正在用python編寫代碼,使用硒和美麗的湯來抓取工作清單和描述的Upwork。我現在不斷收到一條錯誤消息: "Access to this web page is denied. Please make sure your browser supports JavaScript and cookies and that you are not blocking them from load

    0熱度

    1回答

    我正在爲網站Upwork寫一個刮碼,並且需要點擊每個頁面才能找到工作列表。這是我的Python代碼,我使用硒進行網絡爬行。 from bs4 import BeautifulSoup import requests from os.path import basename from selenium import webdriver import time from selenium.w

    0熱度

    1回答

    我試圖寫一個腳本執行谷歌搜索輸入關鍵字,返回僅前10個網址的內容的內容。 注:內容具體指的是由搜索項要求,並在返回的URL的屍體被發現的內容。 我與搜索和排名前10位的URL取出部分完成。下面是該腳本: from google import search top_10_links = search(keyword, tld='com.in', lang='en',stop=10) 但是我無法

    0熱度

    1回答

    HTTP.post我用來刮一個.PDF文件的網站返回一個損壞的文件,這是充滿3F字符顯示爲問號。 例如,在一個給定的保存的文件我有 %PDF-1.4 ,而不是 %PDF-1.4 \ 8 \ D2 \ F0 \ FE 任何想法可能是這個問題的解決方案?

    0熱度

    1回答

    因此,我想將我的擴展工作區(在MAC上)投射到iOS上的應用程序。我已經閱讀了幾天,並單獨列出了Quartz顯示服務API,以便爲每個連接的顯示器直接從GPU捕獲屏幕。 至於我的使用案例,我需要在本地WiFi網絡上通過HTTP流式傳輸,並能夠在我的應用程序中接收它。問題是,如果沒有連接像投影機或顯示器這樣的兼容設備,Mac不會擴展工作區。我如何解決這個問題?我需要能夠通過HTTP/tcp僅轉換擴展

    1熱度

    1回答

    我一直在餐廳的食物衛生刮刀。我能夠讓刮刀根據郵政編碼刮掉餐館的名稱,地址和衛生評級。由於食品衛生通過在線圖像顯示,因此我設置了刮刀來讀取「alt =」參數,其中包含食品衛生評分的數值。 包含IMG ALT標籤我爲食品衛生等級目標的div如下所示: <div class="rating-image" style="clear: right;"> <a href="/business/a

    0熱度

    1回答

    我想使用php刮擦數據。但我不明白我的錯在哪裏。 我想收到「15,50 TL」文本。謝謝 <?php function find($start, $close, $where) { @preg_match_all('/' . preg_quote($start, '/') . '(.*?)'. preg_quote($close, '/').'/i', $where, $

    3熱度

    1回答

    因此,我一直試圖從「2005年至2013年之間喝酒」 颳起「2005 - 2013」​​,起初這段代碼對我有用,但現在我只能得到返回的空列表,我的要求還是有200個狀態碼 import requests, lxml.html, csv headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/5

    -1熱度

    1回答

    因此,我最近開始學習Visual Basic,並正在測試解析HTML數據的樂趣。當我進入一些JSON時,我下載了牛頓軟件包並開始瞭解它的工作原理。我開始只是試圖獲取任何用戶的Instagram頁面的URL,但出現了一個我似乎無法解決的錯誤,而且我剛剛接觸VB,我認爲最好是尋求一些幫助,而不是困惑我的思維。 下面是代碼: Imports HtmlAgilityPack Imports Newton