考慮與存儲在MySQL數據庫中的位置的記錄倒排索引:你如何添加新文檔到一個倒排索引
Word (VARCHAR) | Documents (LONGTEXT)
-------------------------------------------------------------
Hello | {id: 11, freq: 4, pos: [18, 37, 43, 119]},
| {id: 19, freq: 2, pos: [17, 32]}
-------------------------------------------------------------
現在,一個新的文件來和它的大多數話都已經編入索引。現在應該是什麼索引操作?基本方法似乎是,如果該單詞已經存在於數據庫中,那麼獲取它的文檔並將當前文檔添加到它並更新記錄。
這是可持續的文件達到增加,比方說,數以百萬計的數目? Solr,Xapain,Google,Bing等真實世界的搜索引擎如何處理這個問題?