2013-07-12 48 views
5

我有一個文件夾中的這3個文件,它們都與由Lucene的創建索引:瞭解Lucene的細分

  • _0.cfs
  • segments_2
  • segments.gen

它們都用於什麼目的,是否有可能將它們中的任何一個轉換爲人類可讀的格式,以更多地瞭解lucene如何處理其索引?

回答

6

這兩個段文件存儲有關段的信息,.cfs是由其他索引文件(如索引,存儲,刪除等文件)組成的複合文件。

對於不同類型的用於創建一個Lucene索引文件的文檔,請參閱本summary of file extensions

一般來說,沒有,Lucene的文件不是人類可讀。它們的設計更多的是效率和速度,而不是人的可讀性。獲得人類可讀格式的方法是通過Lucene API(通過Luke或Solr或類似的東西)訪問它們。

如果您想全面瞭解正在使用的文件格式,可以在codecs package的地方查找。