2013-06-20 44 views
0

我正在使用massindexer來索引我正在處理的項目的域模型;我的域模型包含存儲在數據庫中的文件字節。我已經使用TikaBridge批註爲我的域對象內的文件集合正確註釋了我的域模型。Hibernate搜索ErrorHandler:繼續索引

大多數我在我的數據庫索引精訪問(200 +,各種格式)的文件,但偶爾文件無法解析無論出於何種原因。這似乎會導致索引器停止處理它的整個當前批次的域對象。我在https://hibernate.atlassian.net/browse/HSEARCH-1354

開設了一個問題,它根據您可以創建自定義錯誤處理程序來處理這類問題的文件; http://docs.jboss.org/hibernate/search/4.3/reference/en-US/html_single/#d0e2582

我不能似乎能夠告訴Hibernate Search的只是忽略了語法錯誤,並且繼續索引。

可某些時候我就這一個正確的方向,讓我知道如何創建忽略提卡文件解析錯誤自定義的ErrorHandler?

回答

1

我無法使自定義的ErrorHandler解決方案工作,所以我最終將org.hibernate.search.bridge.builtin.TikaBridge複製並粘貼到我的代碼庫中,並將其修改爲記錄解析錯誤但繼續移動。

我最終使用以下注釋將它們放在一起。

@Field 
@FieldBridge(impl=com.my.project.CustomTikaBridge.class) 
private byte[] bytes;