2011-09-06 77 views
1

我想在我的Java項目中集成Apache Tika。我需要從不同的文件格式(excel,doc,ppt等)獲取文本。 經過一番閱讀後,我明白構建tika的唯一方法是下載src文件並使用Maven構建它。我執行 「MVN安裝」 在Tika SRC(Apache的蒂卡-0.9-SRC)的根目錄下,但我得到這個錯誤:如何將Tika集成到我的Lucene項目中?

[INFO] Scanning for projects... 
Downloading: http://repo1.maven.org/maven2/org/apache/apache/6/apache-6.pom 
[ERROR] The build could not read 1 project -> [Help 1] 
[ERROR] 
[ERROR] The project org.apache.tika:tika:0.9 (C:\Users\vexler\Documents\Instal 
ls\apache-tika-0.9-src\apache-tika-0.9\pom.xml) has 1 error 
[ERROR]  Non-resolvable parent POM for org.apache.tika:tika-parent:0.9: Could 
not transfer artifact org.apache:apache:pom:6 from/to central (http://repo1.mav 
en.org/maven2): Error transferring file: Connection timed out: connect and 'pare 
nt.relativePath' points at no local POM @ org.apache.tika:tika-parent:0.9, C:\Us 
ers\vexler\Documents\Installs\apache-tika-0.9-src\apache-tika-0.9\tika-parent\po 
m.xml, line 25, column 11 -> [Help 2] 

我真的使用並欣賞這個錯誤的任何幫助。 感謝:-) Reuth

回答

1

你在項目中使用Maven假設,那麼生活是非常簡單得多

只需添加類似

<dependency> 
    <groupId>org.apache.tika</groupId> 
    <artifactId>tika-parsers</artifactId> 
    <version>0.9</version> 
    <scope>provided</scope> 
</dependency> 

和Maven會下載提卡,它的依賴關係

或者,如果您下載最新的Tika OSGi Bundle Jar(例如0.9)並將其解壓縮,那麼您將獲得Tika依賴關係和代碼t

相關問題