2015-10-20 70 views
0

我的問題的簡短版本是,是否可以編寫代碼,而不是打開頁面,而是解析該頁面並在其上打開鏈接?我已閱讀了一些關於使用PHP或Perl或其他工具來解析HTML的內容;這是可以用這樣的工具來完成的嗎?我可以在目標頁面解析HTML並跳轉到其中的鏈接嗎?

我維護一些包含指向特定語言文檔的固定列表的鏈接的頁面。格式是沿着這與註釋掉行線(以通用的方式)一致如果該文檔尚未發佈:

<ul> 
    <li><a href="(en_US link)">English</a></li> 
    <!-- <li><a href="(bg_BG link)">Bulgarian</a></li> --> 
    <!-- <li><a href="(zh_CN link)">Chinese - Simplified</a></li> --> 
    <li><a href="(zn_TW link)">Chinese - Traditional</a></li> 
    ... etc. 
</ul> 

別人已經指向這些頁面。

鑑於其中之一併瞭解所需語言,他們是否可以在頁面中找到該鏈接並跳轉到該頁面,而不是將該行註釋掉?編寫正則表達式很容易,因爲這些嵌入式URL都以xx_XX.pdf結尾,使用任何語言/語言環境。

我不想弄清楚代碼會是什麼,只是如果他們有合適的工具和正確的知識就可以編寫這些代碼。

+0

答案的簡短版本是肯定的,除了原始頁面必須被提取*以及*鏈接頁面。沒有辦法知道一個頁面鏈接到哪個URL而沒有先獲取它 – Borodin

+0

沒有必要在Stack Overflow的代碼段中使用HTML實體。我們使用[*** Markdown ***]版本(https://daringfireball.net/projects/markdown/),並且在[*** Markdown編輯幫助***](http:/ /stackoverflow.com/editing-help) – Borodin

+0

對不起 - 我試圖描述這些模式如何在這些鏈接中保持一致,並且認爲這樣可以更容易形象化。 – user5464905

回答

0

你不給非常多的細節,但沒錯,聽起來這是可能的

傳統上,PHP是一個服務器端的語言,而Perl是更經常在客戶端使用。這將是實現這個Web服務器系統上的壞主意,但如果你正在考慮一個HTTP 客戶那麼它是在幾乎任何語言的可行

如果你不明白客戶端之間的區別服務器然後請詢問

+0

謝謝。這不會在我的最終實現,我不知道另一方是什麼樣子 - 我只知道他們訪問我的網頁作爲用戶交易的一部分(呈現從我身邊接受的條款作爲下載的一部分) 。我告訴第三方,我會試着找出是否有可能做這樣的事情,儘管我不會那麼做。我想這可能是可能的,而且其實很簡單,但它超出了我基本的HTML知識。我會讓他知道有一些工具可以幫助它,並讓他去處理需要在另一端實施它的人。 – user5464905

相關問題