2009-01-21 18 views
2

我需要爲Microsoft Search Server 2008開發一個IFilter,它執行長時間的計算來提取文本。從一個文件中提取文本可能需要5秒到12小時。我如何設計這樣一個IFilter,以便守護程序不會在超時時重置它,並且其他的IFilter在掛起時可以在超時時重置?如何實現一個用於索引重量級格式的IFilter?

回答

3

12小時,哇!

如果需要這麼長時間並且有很多文件,最好的選擇是創建一個預處理應用程序,以提取文本並使其可供iFilter訪問。

另一種選擇是創建文檔的html摘要並指示抓取工具編制索引。如果摘要頁面可以根據需要輕鬆鏈接到文檔本身。

0

我還沒有開發任何過濾器,所以我基本上只是猜測,但我總是理解事情的方式是,IFilter基於塊是基於這個原因。由過濾器實現來確保返回的塊「足夠小」,所以如果事情花費太長時間,調用搜索守護進程可以簡單地在兩塊之間退出。

顯然,我的假設是錯誤的,或者你不會問這個問題。

相關問題