html-parser

    2熱度

    1回答

    我需要一個功能強大的HTML解析器和Objective-C/C的操縱器,比如HTML敏捷包。 誰能告訴我一些最佳的解決方案?一種解決方案是libxml2,但它的接縫不是最好的。 在此先感謝!

    4熱度

    1回答

    我知道有一些庫用於解析HTML HTMLility包,但無法找到支持表單發佈或執行javascript的庫。 我想從我的Windows窗體應用程序發佈html表單,但不想使用WebBrowser控件或MSHTML庫。

    1熱度

    2回答

    我在尋找一個基於Java的html解析器,它可以搜索和替換保留html標籤的文本。這個問題之前已經在這裏問過,但答案似乎沒有達到目標。我下載了很少的html解析器,並且編寫了簡單的程序來查看他們是否可以完成這項工作。這些包括jsoup,Jericho,Java HTML解析器等。這些可以做一個搜索,但是當涉及到替換保留html標籤的文本時,沒有辦法做到這一點。 我已閱讀完整牙這些職位: How t

    0熱度

    1回答

    我使用org.htmlparser.Parser來解析URL,它適用於網絡中的所有內部URL 。但是當我嘗試打開外部URL,它給螺紋 異常「主」 org.htmlparser.util.ParserException: 連接被拒絕:連接; java.net.ConnectException:連接 被拒絕:連接 這條線出現故障 - 分析器p值=新 分析器( 「http://www.google.co

    -1熱度

    2回答

    可能重複: if you know xpath then please help? 喜, 所以這裏是HTML代碼 <html> <body> <table> <tr> Test </tr> <tr> <td> <a href = "google.com"> Google </a> </td> </tr> <tr> <td> test1</td> <td> <a h

    27熱度

    4回答

    像PHP中的DOMDocument類,是否有RUBY中的任何類(即核心RUBY),用於從HTML文檔中解析和獲取節點元素值。

    5熱度

    2回答

    我需要html解析,它能夠識別生成的html中的錯誤,並且如果標記未關閉,請關閉它並返回有效的html。 更多詳細信息:我從數據庫獲取數據並打破該記錄以顯示我的網站上的部分詳細信息,以便點擊更多按鈕,然後顯示完整內容。打破字符串然後驗證。 我已經使用Html敏捷包,但我是新來使用它,如果這個庫解決了我的問題,然後指導我如何(教程)或建議我另一個庫。

    7熱度

    3回答

    我在亂搞GoogleDocs,它有非常非常原始的CSS支持。如果您上傳MSWord .doc或HTML文件並將其導出爲HTML,則所有樣式均以內聯方式應用。他們在html文件中有一個樣式塊,但是當您將HTML文件上傳回google文檔時,它不會應用任何非內聯樣式。 所以我在想「也許這是一個紅寶石工具」。有沒有什麼可以用來獲取一些CSS,並將它解析到HTML節點中,也許是一些nokogiri插件?

    0熱度

    1回答

    好吧,這就是我正在做的。我正在爲以自定義擴展名(.cpm)結尾的文檔進行perl解釋程序。我環顧四周,發現 http://perlmeme.org/tutorials/html_parser.html https://metacpan.org/pod/HTML::TokeParser::Simple http://www.justskins.com/forums/html-parser-8489.

    1熱度

    1回答

    我想使用解析器來確定正文文本內特定H2(或h3/h4/h5/h6)文本發生的位置編號。通過位置編號I表示在此特定h2(或h3/h4/h5/h6)短語之前發生的'單詞'數量......另外,如果短語同時出現在h2和h4文本中(例如),則我如何確保我獲得這兩個文本的正確位置編號?