screen-scraping

    2熱度

    1回答

    我們必須從現有VB6應用程序中讀取文本。所以我們在kernel32中使用FindWindow,GetWindowText和EnumChildWindows方法,並且可以在這個過程中枚舉和讀取顯示的文本。 我們能夠使用我們的方法讀取90%的文本,但總體上有一個我們無法閱讀的特定控件(或框)。 我們不能使用UI間諜類型程序來定位我們需要閱讀的文本,所以我假設他們必須將它直接渲染到GDI/GDI +的屏

    0熱度

    2回答

    當發佈一個鏈接到你的Facebook個人主頁上,用戶都帶有選項來選擇縮略圖來表示的鏈接,如下面的示例所示: http://www.everyday.com.my/photo/2009/4/Add-Sushi-King-into-my-Facebook-profile.jpg (新用戶不允許嵌入圖像) 呈現給用戶的縮略圖是共享/鏈接到的頁面上包含的不同圖像。 任何人有關於Facebook使用什麼過程

    1熱度

    2回答

    許多網頁使用onload JavaScript來操作它們的DOM。有沒有一種方法可以在這些JavaScript操作之後自動訪問HTML的狀態? 一個像wget一樣在這裏沒有用,因爲它只是下載原始源代碼。 有沒有可能使用Web瀏覽器渲染引擎的方法? 理想情況下,我正在使用一種可以與Python接口的解決方案。 謝謝!

    0熱度

    3回答

    我從使用Frontpage(最初)和Dreamweaver(最近)在ASP中構建的10 year old website中獲取一些信息。我正在使用PHP。 我找回空格不是空格的字符串。使用PHP修剪功能,可以刪除一些空白區域,但不是全部。 original string: string(47) " School Calendar" trimmed string: string(34) " Sch

    0熱度

    1回答

    我正在運行一堆從網站上抓取數據的腳本。由於我不會讓你感到厭煩的原因,我無法將它們全部從同一個主機上運行 - 相反,我需要設置六個不同的主機。我想配置我的主機設置以掩飾所有六臺主機擁有相同所有者的事實。 我已經獲得位於不同地理位置的六個不同的共享主機帳戶。還有什麼我需要做的?應該爲每個主機購買不同的域名?如果不是,我應該給每個主機分配哪個域名?

    1熱度

    1回答

    我正在抓取一些數據,並且想要獲取具有值的特定標記之後的元素值。 這是一個值爲'Types:'的大膽標記。 <b>Types:</b> 一旦我到達那個元素,我可以使用Prototype的Element.next()來獲取我想要的數據。 我到底該怎麼做? 我一直在擺弄$$,但似乎無法得到正確的結果。 謝謝!

    32熱度

    7回答

    問題 當使用python屏幕抓取網頁時,必須知道頁面的字符編碼。如果你的字符編碼錯誤,你的輸出會被搞亂。 人們通常會使用一些基本的技術來檢測編碼。他們要麼使用標題中的字符集,要麼使用元標記中定義的字符集,或者使用encoding detector(它不關心元標記或標題)。 通過僅使用一種這些技術,有時您將得不到與在瀏覽器中相同的結果。 瀏覽器做這種方式: Meta標籤始終把標題中定義的優先級(或X

    0熱度

    3回答

    我們有一個基本上是榮耀的telnet界面的遺留系統。 我們不能使用替代的telnet客戶端程序連接到系統,因爲它們提供給我們的客戶端軟件中內置了特殊功能。 我想能夠從這個程序中刮屏幕,但這是非常困難的。 我試過使用WindowSpy和Spy ++來檢查窗口文本,它出現空白。 這是一個由供應商編寫的自定義C程序(他們甚至禁用了選擇文本)。 我真的在尋找一個免費的選項,我可能可以結合使用腳本語言。 這

    0熱度

    5回答

    我試圖從網站上刮取一些信息,但在閱讀相關頁面時遇到困難。頁面似乎首先發送一個基本的設置,然後是更詳細的信息。我的下載嘗試似乎只捕獲基本設置。到目前爲止,我已經嘗試過urllib和機械化。 儘管在查看頁面源代碼時看不到我想要的部分,但Firefox和Chrome在顯示頁面時沒有任何問題。 示例URL是https://personal.vanguard.com/us/funds/snapshot?Fu

    1熱度

    1回答

    我想從一個文本文件列表中抓取一些頁面,並將它們保存到我的服務器上。 我有以下代碼(與域隱晦),剔除從文件目錄的文本文件列表,然後複製文件名稱,但附加.html。 出於某種原因,它創建的文件沒有真正成功寫入它們。我究竟做錯了什麼? <?php $file = fopen("list.txt","r"); while(! feof($file)) { $line = fgets($f