2015-10-15 97 views
-1

我想解析一個web文檔。使用HtmlAgilityPack(C#) 這正是尋找標籤的href值。HtmlAgilityPack解析的值不同

我解析http://www.ntis.go.kr/ThRndGateList.do

雖然成功的解析,數值略有不同。 我不知道爲什麼。

網絡的實際值如下:

enter image description here

通過Htmlagilitypack得到的數值如下:

enter image description here

正如你可以看到,這個奇怪的起點在href值中獲得「jsessionid」值。什麼原因?

謝謝你的問候。

+0

能否請您複製粘貼HTML和解析結果的文本?我從這些圖片中看不到任何東西 –

+1

難道是,您是在您的瀏覽器中登錄到本網站的嗎? –

+0

實際值:/ThRndGateView.do?searchType=&idx=211166&pageNumber=1&searchWord= –

回答

0

這可能是因爲在你的瀏覽器(在你的情況下,Chrome瀏覽器)您登錄如果您通過HtmlAgilityPack發出請求你像一個剛打開的瀏覽器:

  • 未登錄
  • 決不此頁面上

您要使用的web應用之前,當有人打開首次頁面生成JSESSIONID這個ID是通過URL轉移。

這個問題可以幫助你瞭解web應用背後的技術:Under what conditions is a JSESSIONID created?