lynx

    -1熱度

    1回答

    我的單頁設計網站上有幾個錨點。那些通過JavaScript動畫的人不能在屏幕閱讀器lynx中工作。 單擊其中一個鏈接始終定位此頁面上的第一個錨點。 由於Javascript不會影響(通常)屏幕閱讀器的行爲 - 我該怎麼辦? @Allan:感謝您的幫助! 因此,這裏是一些代碼:鏈接到主導航,只能通過屏幕閱讀器看到直接跳轉到id爲「mainnavi」鏈接: <p class="sreenreader-

    1熱度

    1回答

    我試圖在我的perl cgi腳本中運行lynx,以便從wen頁面中提取一些文本。我這樣做是在我的腳本通過以下方式, lynx -source -preparsed "$url" > data.txt 但我得到我的服務器的error_log以下錯誤: 仰望www.xyz.com 使HTTP連接到www.xyz.com警報!: 無法連接到遠程主機。 山貓:無法訪問startfile xyz.com 我

    0熱度

    1回答

    我用lynx轉儲網站。 lynx -dump https://URL.com > file.txt 某些URL被分成兩行,如果可能,我想停止。我有什麼選擇嗎? 我運行一個sed命令,去除行不以http,所以你可以看到這個問題。 謝謝, 克里斯 編輯:我要補充一點,我想的鏈接不要把得到的可見或隱藏鏈接部分。

    1熱度

    1回答

    我想在Amazon EC2 Linux中設置一個cron以在每天晚上12:15 AM運行SOLR全導入。 在我設置cron之前,我嘗試在終端中測試它是否正常工作。我用下面的命令來測試 /usr/bin/lynx http://amzon-instance-ip:8983/solr/work/dataimport?command=full-import 輸出命令: [1] 15153 但是,

    -1熱度

    1回答

    HTML文件中提取文本我有一個腳本: cd ../data; dossier=$(ls crawl); let "compte = 1"; for file in $dossier do lynx --dump --nolist $file >> ../data/txt/$compte'.txt'; let "compte = compte + 1"; done 我使用l

    0熱度

    1回答

    我正在嘗試從10個URL的.txt文件中提取原始數據,並將每行(URL)的原始數據放在.txt文件中。然後通過使用Python重複處理過程中的數據(來自同一個原始.txt文件的原始數據被剝離了html)。 import commands import os import json # RAW DATA input = open('uri.txt', 'r') t_1 = open('c

    1熱度

    2回答

    正如我研究的最聰明的方式是使用API​​,但使用cURL時,我可以在輸出中找到所有需要的信息,但它有點混亂。 curl https://www.youtube.com/user/HowdiniGuru/videos | grep "watch?" 返回包含視頻網址,所有需要的塊: <h3 class="yt-lockup-title "><a class="yt-uix-sessionlink

    0熱度

    1回答

    我需要編寫一個腳本,告訴給定網站(第一個參數)是否已更改。我寫了類似的東西,但它不工作,不能讓發現錯誤 #!/bin/bash website=$1 time=$2 #frequency of checking the page x=1 spr=$(diff -s ttt.txt ttt1.txt) lynx -dump $website | cat > ttt.txt ttt1.t

    0熱度

    2回答

    我正在運行lynx來測試我必須做的一些HTML,因爲考慮到可訪問性。我猜想,如果Lynx看起來很漂亮,那麼屏幕閱讀器,蹩腳手機和其他東西的整個範圍都可以,甚至是大多數古老的硬件。 在某些情況下,我使用了一個快捷方式,以防止在支持和啓用JS的常規情況下一次性清除所有靜態HTML,包括將所有靜態HTML標記嵌套在標識的div標記中被消滅。 後來我意識到,引起了我的lynx編譯行爲改變: <!DOCTY

    1熱度

    1回答

    我想用grep的結果對猞猁命令 lynx -head -dump http://abdsadsac.org 結果該命令 Looking up 111.111.111.111:9004 Making HTTP connection to 111.111.111.111:9004 Alert!: Unable to connect to remote host. lynx: Can't a