2013-10-30 105 views
0

我正在嘗試以下代碼閱讀網頁內容, 我想閱讀鏈接,鏈接下方的作者姓名和右側的PDF或HTML鏈接到我的數據庫或者一些使用Java的doc文件。上面是我的代碼,早些時候它給了我403錯誤,但是當我把useragent(「Mozilla」),然後它給我空指針異常。Java,Jsoup,閱讀html網頁內容

Exception in thread "main" java.lang.NullPointerException 
     at HTMLParserExample1.main(HTMLParserExample1.java:20) 
Java Result: 1 
BUILD SUCCESSFUL (total time: 1 second) 

請幫忙。

+0

我想你的鏈接是錯誤的,它甚至不能在我的瀏覽器上工作:) –

+0

http://scholar.google.com/scholar? l = en&q = visualization&btnG =&as_sdt = 1%2C4&as_sdtp =這個鏈接是錯誤的,因此問題 – Jhanvi

回答

1

那麼它適用於我,如果我從網址中刪除空格 http://scholar.google.com/scholar?l=en&q=visualization&btnG=&as_sdt=1%2C4&as_sdtp= 就好了。我強烈建議使用Google API進行網上搜索,以確保直接進行Google解析。 Here some info about Gdata API

+0

這裏鏈接有'h而不是空格,仍然無法得到,就是你使用的是相同的代碼還是你有你自己的。 – A8H1

+0

我粘貼了你工作過的鏈接。 – Antoniossss