我的問題的簡短版本是,是否可以編寫代碼,而不是打開頁面,而是解析該頁面並在其上打開鏈接?我已閱讀了一些關於使用PHP或Perl或其他工具來解析HTML的內容;這是可以用這樣的工具來完成的嗎?我可以在目標頁面解析HTML並跳轉到其中的鏈接嗎?
我維護一些包含指向特定語言文檔的固定列表的鏈接的頁面。格式是沿着這與註釋掉行線(以通用的方式)一致如果該文檔尚未發佈:
<ul>
<li><a href="(en_US link)">English</a></li>
<!-- <li><a href="(bg_BG link)">Bulgarian</a></li> -->
<!-- <li><a href="(zh_CN link)">Chinese - Simplified</a></li> -->
<li><a href="(zn_TW link)">Chinese - Traditional</a></li>
... etc.
</ul>
別人已經指向這些頁面。
鑑於其中之一併瞭解所需語言,他們是否可以在頁面中找到該鏈接並跳轉到該頁面,而不是將該行註釋掉?編寫正則表達式很容易,因爲這些嵌入式URL都以xx_XX.pdf
結尾,使用任何語言/語言環境。
我不想弄清楚代碼會是什麼,只是如果他們有合適的工具和正確的知識就可以編寫這些代碼。
答案的簡短版本是肯定的,除了原始頁面必須被提取*以及*鏈接頁面。沒有辦法知道一個頁面鏈接到哪個URL而沒有先獲取它 – Borodin
沒有必要在Stack Overflow的代碼段中使用HTML實體。我們使用[*** Markdown ***]版本(https://daringfireball.net/projects/markdown/),並且在[*** Markdown編輯幫助***](http:/ /stackoverflow.com/editing-help) – Borodin
對不起 - 我試圖描述這些模式如何在這些鏈接中保持一致,並且認爲這樣可以更容易形象化。 – user5464905