2014-04-01 69 views
1

如何最大限度地減少我的草垛指數所佔用的硬盤空間佔用硬盤空間?索引佔用比整個數據庫更多的空間,哈哈!我正在索引大文本部分。減少草堆指數

我想刪除所有數字和HTML標籤。但這些只是合乎邏輯的嘗試,因爲較小的輸入=較小的輸出。但我認爲我缺少乾草堆工作的基本方式,以及索引變得比數據庫本身更大的原因。

在我的索引模板,我有一些文本和日期字段。

編輯:下面是我創建索引文件和模板的樣本。讓我知道如果我做錯了什麼或效率低下。所有的字段都是可搜索的。

search_indexes.py:

class MainIndex(indexes.SearchIndex, indexes.Indexable): 
    text = indexes.CharField(document=True, use_template=True) 
    pnum = indexes.CharField(null=True) 
    anum = indexes.CharField(model_attr='anum', null=True) 
    ititle = indexes.CharField(model_attr='ititle', null=True) 
    de = indexes.CharField(null=True) 
    cs = indexes.CharField(null=True) 
    ab = indexes.CharField(null=True) 
    in = indexes.CharField(null=True) 
    as = indexes.CharField(null=True) 
    pt = indexes.CharField(null=True) 

main_text.text:

{{ object.pnum }} 
{{ object.anum }} 
{{ object.de }} 
{{ object.cs }} 
{{ object.ab }} 
{{ object.in }} 
{{ object.as }} 
{{ object.ititle }} 
{{ object.ps}} 

回答

0

從任何索引的好處是,它可以防止過多的處理查詢,因此索引可以預處理,結果從該是以地圖和樹形指向真實數據的元信息來簡化查詢工作。

你應該只在被搜索數據的索引。

+0

請看看我的索引和模板摘錄以上,讓我知道,如果你有其他意見。我意識到這個問題很模糊,但你的答案只是顯而易見,而我需要特定的指導。請協助 – user2104778