2013-07-29 38 views
0

對第一個問題的鏈接可以在這裏找到:運行散列(校驗)

Using VB.NET to Detect Changes in a Web Page

我做了它的編輯,但被告知要重新提交的新問題。但使用上面的鏈接,你可以得到一個大概的想法。在下面進行編輯。謝謝!

對這個問題的新轉折抱歉。我有更多時間思考我們想要的東西。所以...檢測網頁上的任何更改都會很愚蠢,因爲頁面的時間依賴元素每隔一段時間都會發生變化。相反,我想要做的是能夠檢測頁面中的文檔。例如,如果在該頁面上有excel,word docs或pdfs被更改。因此,我會在這些文檔上運行哈希,然後按照某種時間表進行檢查,以查看是否添加了新文檔或是否修改了舊文檔。有關如何檢測頁面上嵌入的文檔並運行散列的任何建議?再次感謝!

+0

有什麼想法?凹凸 –

+0

和另一個凹凸 –

回答

0

我將從一條元建議開始:當提問的答案可能依賴於.NET本身,或者更普遍的編程時,請使用標籤說明,並且不要使用像VB.NET這樣的標籤,因爲大多數.NET社區都使用C#,並且他們通常不會看到它。

關於您的實際問題,具體情況將取決於您需要檢查什麼,但總的來說,這聽起來像你需要定義的頁面中感興趣地區,比方說,一個CSS選擇器識別。因此,假設你正在觀看的頁面有文件有點列表,該列表的編碼方式類似於這樣:

<p>New this week!</p> 
<ul class="new-docs"> 
    <li><a href="...">Some Doc</a></li> 
    <li><a href="...">Some Other Doc</a></li> 
</ul> 

所以你編寫一些代碼來下載這個頁面並提取元素與選擇ul.new-docs然後進行測試通過在整個HTML塊上使用散列/校驗和,或通過顯式記錄每個子項並將新列表與舊列表進行比較來進行更改。

您可能會發現this thread供選擇實際提取HTML的給位一旦你下載了頁面的幫助。

+0

感謝您的信息。我想了一會兒。我需要用答案更新它。再次感謝! –