2010-09-29 69 views
1

有沒有人遇到過標準html解析器插件處理相關URL的問題?有一個網站 - http://xxxx/asp/list_books.asp?id_f=11327 和瀏覽其HREF 的鏈接設置爲 「id_r = 442 & ID = 41 &爲了=?」,當瀏覽器自然會帶你到 http://xxxx/asp/list_books.asp?id_r=442&id=41&order=nutch crawler相關網址問題

然而,在Nutch的時候outlinks解析從頁面鏈接結束爲 http://xxxx/asp/?id_r=442&id=41&order=

當然是壞了。那麼爲什麼list_books.asp不見了?

+0

我發現同樣的錯誤在OmniFind中http://omnifind.ibm.yahoo.net/ – user183038 2010-10-07 09:41:45

回答

3

A bug已經爲此記錄。看一看。

+0

這個補丁幫我 - https://issues.apache.org/jira/browse/NUTCH-797?page=com.atlassian .jira.plugin.system.issuetabpanels:全個tabpanel – user183038 2010-09-29 12:01:11