2012-02-23 156 views
1

我正在使用Tika解析器將我的文件編入索引。我創建了我自己的解析器(它擴展了XMLParser)。它使用我自己的mimetype。 我創建了一個jar文件,其中內部看起來是這樣的:解析(使用Tika)遠程玻璃魚

src 
|-main 
    |-some_packages 
     |-MyParser.java 
    |resources 
     |-META-INF 
      |-services 
       |-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java) 
     |_org 
      |-apache 
       |-tika 
        |-mime 
         |-custom-mimetypes.xml 

在自定義MIME類型,我把新的MIME類型定義becouse我的XML文件中有一些特殊的標記。

現在問題在哪裏:我一直在使用我的本地機器上安裝的glassfish上的Solr測試解析和索引。它工作得很好。然後我想將它安裝在某個遠程服務器上。安裝了相同版本的glassfish(3.1.1)。我複製粘貼的Solr應用程序,它是所有庫的主目錄(包括tika jar和我的自定義分析器的jar)。不幸的是它不起作用。將文件發佈到Solr後,我可以在內容類型字段中看到它檢測到我的自定義MIME類型。但是,如果MyParser類從未運行過,那麼就沒有假設存在的字段。唯一的領域是都柏林核心的。我檢查了(通過簡單地添加一些printlines),Tika只使用XMLParser。 有沒有人有類似的問題?如何處理這個?

+1

解決:)原來,這個問題是使用Java 7 ... – lotk 2012-02-23 13:58:23

+0

你可能想補充說,作爲答案 – Gagravarr 2012-02-25 10:39:13

回答

0

問題是,我是使用Java 7編譯我的解析器但是Apache提卡與Java 5的編譯...