我是elasticsearch的新手,但並不真正知道如何考慮磁盤空間&設置河流(我的情況是一條mysql河)涉及的內存使用情況。elasticsearch河的開銷?
河流的開銷是多少?尤其是關於磁盤空間&的內存使用情況?This has been asked但未回答。換句話說,假設我有一個有3列的表:primary_key(integer),url(varchar)和document_text(text)。另外,假設我目前在mysql中進行全文搜索100%(愚蠢,我知道,但僅僅是爲了爭辯)。 3列中的每一列都有一個索引,「document_text」索引是全文索引。這是一個非常大的表格,我想盡量減少重複的數據。
我應該怎麼考慮發生了什麼事情與一個mysql河? 隨着一條河,我會直接從「document_text」列刪除全文索引 &移動到elasticsearch(以及來自mysql的primary_key)? Elasticsearch不需要爲「url」編制索引,因爲我們沒有在這方面搜索,對嗎? document_text的數據存儲在mysql中,但索引存儲在elasticsearch中,因此實際使用的磁盤空間增加了零。
編輯:
我想我的主要問題是將我兩次存儲底層數據或不elasticsearch只存儲索引?