有沒有人遇到過標準html解析器插件處理相關URL的問題?有一個網站 - http://xxxx/asp/list_books.asp?id_f=11327 和瀏覽其HREF 的鏈接設置爲 「id_r = 442 & ID = 41 &爲了=?」,當瀏覽器自然會帶你到 http://xxxx/asp/list_books.asp?id_r=442&id=41&order=nutch crawler相關網址問題
然而,在Nutch的時候outlinks解析從頁面鏈接結束爲 http://xxxx/asp/?id_r=442&id=41&order=
當然是壞了。那麼爲什麼list_books.asp不見了?
我發現同樣的錯誤在OmniFind中http://omnifind.ibm.yahoo.net/ – user183038 2010-10-07 09:41:45