描述:我有一個巨大的MySQL數據庫表。總大小約爲10兆兆字節。它只包含文本。任何方式來減少文字的大小?
從這個數據庫表中的示例文本:
在其他情況下,一些國家也逐漸學會了生產同樣的產品,並且以前只有美國等少數國家能夠生產服務。美國實際收入增長放緩。
約有500億不同的文字。
我試過了什麼?
我試過將它們全部壓縮。事實上,它已經工作,減少了總大小。但是,我需要進行搜索,並且在位於zip文件中時我無法搜索任何數據。
我試過PHP的base64
編碼。它使我的示例文本數據爲:
SW4gb3RoZXIgY2FzZXMsIHNvbWUgY291bnRyaWVzIGhhdmUgZ3JhZHVhbGx5IGxlYXJuZW QgdG8gcHJvZHVjZSB0aGUgc2FtZSBwcm9kdWN0cyBhbmQgc2VydmljZXMgdGhhdCBwcmV2 aW91c2x5IG9ubHkgdGhlIFUuUy4gYW5kIGEgZmV3IG90aGVyIGNvdW50cmllcyBjb3VsZC Bwcm9kdWNlLiBSZWFsIGluY29tZSBncm93dGggaW4gdGhlIFUuUy4gaGFzIHNsb3dlZC4 =
我想什麼來實現?
我想在發送到MySQL之前減少文本的大小。首先,我不知道我能做這份工作。我正在考慮加密和解密數據。
所以,這裏是我想要做的一個例子:
我想在存儲之前對文本數據進行加密。然後,我想調用來自MySQL的加密數據來解密。
任何可以縮小文字大小的方法? Base64不適合我,有沒有其他方法?
你需要全文檢索嗎?在這種情況下,你不能壓縮或你的MySQL將無法抓取文本。無論如何,在這裏粘貼你的數據庫內容。 – moonwave99
也許Lucene http://lucene.apache.org/是你正在尋找的。它是爲你試圖從事的事情而設計的:搜索大量文本 –
是的,我確實需要全文搜索。 –