2012-06-19 46 views
0

dbpedia spotlight dataset延續,我也跟着更新我的數據集的指示,但得到了以下錯誤:DBpedia的聚光燈數據集

INFO 2012-06-19 11:58:04,300 main [MergedOccurrencesContextSearcher] - Using index at: [email protected]/home/user_name/new/spotlight/index [email protected] 
Exception in thread "main" java.io.FileNotFoundException: /home/user_name/new/spotlight/index/segments_bp (No such file or directory) 
    at java.io.RandomAccessFile.open(Native Method) 
    at java.io.RandomAccessFile.<init>(RandomAccessFile.java:233) 
    at org.apache.lucene.store.MMapDirectory.openInput(MMapDirectory.java:219) 
    at org.apache.lucene.store.FSDirectory.openInput(FSDirectory.java:345) 
    at org.apache.lucene.index.SegmentInfos.read(SegmentInfos.java:265) 
    at org.apache.lucene.index.DirectoryReader$1.doBody(DirectoryReader.java:76) 
    at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:709) 
    at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:72) 
    at org.apache.lucene.index.IndexReader.open(IndexReader.java:273) 
    at org.dbpedia.spotlight.lucene.search.BaseSearcher.<init>(BaseSearcher.java:67) 
    at org.dbpedia.spotlight.lucene.search.MergedOccurrencesContextSearcher.<init>(MergedOccurrencesContextSearcher.java:64) 
    at org.dbpedia.spotlight.model.SpotlightFactory.<init>(SpotlightFactory.scala:71) 
    at org.dbpedia.spotlight.web.rest.Server.main(Server.java:86) 

我已經能夠成功地使用去污劑字典,但不能使用索引文件。

你能幫我嗎?

回答

0

如果沒有足夠的信息,很難幫助您。該消息抱怨文件不在那裏。那裏有文件嗎?那裏有目錄嗎?

,請複製粘貼命令 ls -lah /home/user_name/new/spotlight/index

+0

遺憾的痛苦的結果。我找到了我的問題的答案。單獨解壓縮文件時出現了問題,這是我之前使用的。否則你的指導幫助了我很多。 順便說一句,我讀了這篇論文,看到了Spotlight的可配置實現,並且有興趣爲它配置社交媒體文本。你能幫助我如何以及從哪裏開始編輯和修改代碼以達到我的目的。 – learner

+0

社交媒體文字很短,並且通常不是非常集中。這意味着您應該儘可能多地使用額外的信息來幫助算法。但是,更重要的是,我們需要知道你想從文本中提取什麼樣的東西:主題,人物,地點,什麼?討論這個問題的最好的地方在於我們的[dbp-spotlight-users](https://lists.sourceforge.net/lists/listinfo/dbp-spotlight-users)列表。 –