0
在dbpedia spotlight dataset延續,我也跟着更新我的數據集的指示,但得到了以下錯誤:DBpedia的聚光燈數據集
INFO 2012-06-19 11:58:04,300 main [MergedOccurrencesContextSearcher] - Using index at: [email protected]/home/user_name/new/spotlight/index [email protected]
Exception in thread "main" java.io.FileNotFoundException: /home/user_name/new/spotlight/index/segments_bp (No such file or directory)
at java.io.RandomAccessFile.open(Native Method)
at java.io.RandomAccessFile.<init>(RandomAccessFile.java:233)
at org.apache.lucene.store.MMapDirectory.openInput(MMapDirectory.java:219)
at org.apache.lucene.store.FSDirectory.openInput(FSDirectory.java:345)
at org.apache.lucene.index.SegmentInfos.read(SegmentInfos.java:265)
at org.apache.lucene.index.DirectoryReader$1.doBody(DirectoryReader.java:76)
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:709)
at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:72)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:273)
at org.dbpedia.spotlight.lucene.search.BaseSearcher.<init>(BaseSearcher.java:67)
at org.dbpedia.spotlight.lucene.search.MergedOccurrencesContextSearcher.<init>(MergedOccurrencesContextSearcher.java:64)
at org.dbpedia.spotlight.model.SpotlightFactory.<init>(SpotlightFactory.scala:71)
at org.dbpedia.spotlight.web.rest.Server.main(Server.java:86)
我已經能夠成功地使用去污劑字典,但不能使用索引文件。
你能幫我嗎?
遺憾的痛苦的結果。我找到了我的問題的答案。單獨解壓縮文件時出現了問題,這是我之前使用的。否則你的指導幫助了我很多。 順便說一句,我讀了這篇論文,看到了Spotlight的可配置實現,並且有興趣爲它配置社交媒體文本。你能幫助我如何以及從哪裏開始編輯和修改代碼以達到我的目的。 – learner
社交媒體文字很短,並且通常不是非常集中。這意味着您應該儘可能多地使用額外的信息來幫助算法。但是,更重要的是,我們需要知道你想從文本中提取什麼樣的東西:主題,人物,地點,什麼?討論這個問題的最好的地方在於我們的[dbp-spotlight-users](https://lists.sourceforge.net/lists/listinfo/dbp-spotlight-users)列表。 –