我可以在目標頁面解析HTML並跳轉到其中的鏈接嗎？

我的問題的簡短版本是，是否可以編寫代碼，而不是打開頁面，而是解析該頁面並在其上打開鏈接？我已閱讀了一些關於使用PHP或Perl或其他工具來解析HTML的內容;這是可以用這樣的工具來完成的嗎？我可以在目標頁面解析HTML並跳轉到其中的鏈接嗎？

我維護一些包含指向特定語言文檔的固定列表的鏈接的頁面。格式是沿着這與註釋掉行線（以通用的方式）一致如果該文檔尚未發佈：

<ul> 
    <li><a href="(en_US link)">English</a></li> 
    <!-- <li><a href="(bg_BG link)">Bulgarian</a></li> --> 
    <!-- <li><a href="(zh_CN link)">Chinese - Simplified</a></li> --> 
    <li><a href="(zn_TW link)">Chinese - Traditional</a></li> 
    ... etc. 
</ul>

別人已經指向這些頁面。

鑑於其中之一併瞭解所需語言，他們是否可以在頁面中找到該鏈接並跳轉到該頁面，而不是將該行註釋掉？編寫正則表達式很容易，因爲這些嵌入式URL都以xx_XX.pdf結尾，使用任何語言/語言環境。

我不想弄清楚代碼會是什麼，只是如果他們有合適的工具和正確的知識就可以編寫這些代碼。

來源

2015-10-20 user5464905

答案的簡短版本是肯定的，除了原始頁面必須被提取*以及*鏈接頁面。沒有辦法知道一個頁面鏈接到哪個URL而沒有先獲取它 – Borodin

沒有必要在Stack Overflow的代碼段中使用HTML實體。我們使用[*** Markdown ***]版本（https://daringfireball.net/projects/markdown/），並且在[*** Markdown編輯幫助***]（http：/ /stackoverflow.com/editing-help） – Borodin

對不起 - 我試圖描述這些模式如何在這些鏈接中保持一致，並且認爲這樣可以更容易形象化。 – user5464905

你不給非常多的細節，但沒錯，聽起來這是可能的

傳統上，PHP是一個服務器端的語言，而Perl是更經常在客戶端使用。這將是實現這個Web服務器系統上的壞主意，但如果你正在考慮一個HTTP 客戶那麼它是在幾乎任何語言的可行

如果你不明白客戶端之間的區別和服務器然後請詢問

來源

2015-10-20 00:57:04 Borodin

謝謝。這不會在我的最終實現，我不知道另一方是什麼樣子 - 我只知道他們訪問我的網頁作爲用戶交易的一部分（呈現從我身邊接受的條款作爲下載的一部分）。我告訴第三方，我會試着找出是否有可能做這樣的事情，儘管我不會那麼做。我想這可能是可能的，而且其實很簡單，但它超出了我基本的HTML知識。我會讓他知道有一些工具可以幫助它，並讓他去處理需要在另一端實施它的人。 – user5464905

我可以在目標頁面解析HTML並跳轉到其中的鏈接嗎？

回答

相關問題