0
我希望在lucene中的應用程序的少數數據庫中索引數據。如何構建索引? 每個表的索引,以便列是字段和數據是值? 或索引每個數據庫,變量表列與lucene的diff字段? 如果沒有那麼如何構建索引,以便搜索和維護不會複雜?假設每個數據庫100個表和每個表10K個行。在lucene中索引數據庫記錄
我希望在lucene中的應用程序的少數數據庫中索引數據。如何構建索引? 每個表的索引,以便列是字段和數據是值? 或索引每個數據庫,變量表列與lucene的diff字段? 如果沒有那麼如何構建索引,以便搜索和維護不會複雜?假設每個數據庫100個表和每個表10K個行。在lucene中索引數據庫記錄
它完全依賴於底層數據,以及如何查詢它,而不知道這是不可能提供明確的答案。
如果你的數據庫模式是規範化的,你可能需要對它進行規範化處理,以創建一個記錄,該記錄由多個表格和每個文檔的表格數據組成。
確定分配給文檔的字段的另一個因素是您要如何查詢數據。
例如,給出下面的規範化模式:
TABLE:AUTHOR COLS:AUTHOR_ID,NAME
TABLE:BOOKS COLS:BOOK_ID,TITLE,CONTENT
TABLE:AUTHOR_BOOKS COLS:AUTHOR_ID,BOOK_ID
你可以索引每撰文/本書單個文檔:
Document (field1:author, field2:title, field3:content)
這將允許你搜索書無論是作者相匹配,標題或內容。