2011-04-15 42 views
0

我使用露天ECM使用老虎OCR庫()露天ECM內容轉換

我的自定義轉換XML(OCR變壓器上下文)是

<?xml version='1.0' encoding='UTF-8'?> 
<!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'> 

<beans> 

    <bean id="transformer.Ocr.Tiff2Pdf" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker"> 
     <property name="checkCommand"> 
     <bean class="org.alfresco.util.exec.RuntimeExec"> 
      <property name="commandsAndArguments"> 
       <map> 
        <entry key=".*"> 
        <list> 
         <value>c:\ocr\ocr.exe</value> 
         <value>--about</value> 
        </list> 
        </entry> 
       </map> 
      </property> 

     </bean> 
     </property> 
     <property name="transformCommand"> 
     <bean class="org.alfresco.util.exec.RuntimeExec"> 
      <property name="commandsAndArguments"> 
       <map> 
        <entry key="Windows.*"> 
        <list> 
         <value>c:\ocr\ocr.exe</value> 
         <value>--replace</value> 
         <value>--replace</value> 
         <value>--language en</value> 
         <value>--pdf</value> 
         <value>--output-file</value> 
         <value>${target}</value> 
         <value>${source}</value> 
        </list>      
        </entry> 
       </map> 
      </property> 

     </bean> 
     </property> 
     <property name="explicitTransformations"> 
     <list> 
      <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" > 
       <property name="sourceMimetype"><value>image/tiff</value></property> 
       <property name="targetMimetype"><value>application/pdf</value></property> 
      </bean> 
      <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" > 
       <property name="sourceMimetype"><value>image/tiff</value></property> 
       <property name="targetMimetype"><value>text/plain</value></property> 
      </bean>   
     </list> 
     </property> 
    </bean> 
</beans> 

轉換TIFF爲PDF當我將TIFF文件導入公司主文件夾我現在期望將內容轉換爲PDF。現在我正確地假設轉換是自動的還是需要在空間上調用規則?

而且,我已經設置了日誌記錄了改造DEBUG,這是我在露天日誌中看到

DEBUG [util.exec.RuntimeExec] 執行結果:操作系統:
的Windows XP命令:
[C:\ OCR \ ocr.exe,--about]
成功:真退出代碼:0
出:Intelliant OCR命令行實用程序 ,版本1.1.0。版權所有© 2006年

現金

TIFF庫版權所有(C)1988-1997 山姆萊弗勒版權所有(C)1991-1997 Silicon Graphics公司

獨立JPEG小組庫
Copyright(C)1991-19 User:admin DEBUG [content.transform.ContentTransformerRegistry] 搜索變壓器:源 mimetype:image/tiff target mimetype:text/plain變形金剛: []

好像它搜索文本/純文本的目標,當我真的需要它轉換爲PDF。我在這裏錯過了什麼?請幫助

回答

1

將自動運行的唯一轉換是純文本文本,用於全文索引。

如果您使用共享,那麼Share會嘗試爲您再做兩次轉換。首先,當你用文件查看文件夾時,它會嘗試生成縮略圖(通過再現服務)。爲了達到這個目的,你通常需要定義一個從新的MIME類型到image/jpeg的轉換器。此外,當您在共享中查看文檔詳細信息時,它會嘗試爲您提供網絡預覽。

如果您希望在上傳文檔時生成PDF文檔,那麼您需要定義規則。你可以用變換內容規則來做到這一點,或者你可以編寫一個腳本來使用Rendition服務,如果你想對它進行很多的控制。