我只是想知道,如果我們能夠實現Lucene的RDBMS功能。使用Lucene像關係數據庫
例: 1)我有10,000個項目文檔(PDF文件),它必須與他們的內容進行索引,以使其可用於搜索。 2)每個文檔都與單個項目相關。該項目可以包含項目名稱,編號,開始日期,結束日期,位置,類型等詳細信息。
我必須在pdf文件的內容中搜索給定的關鍵字,但顯示結果時我想顯示第(2)點所述的項目元數據。
我的想法是一個叫專案編號字段建立索引時每個PDF文件相關聯。一旦我們得到這些,我們將再次搜索獲取項目元數據。
這種方式,我們可以避免重複數據。另外,如果我們想更新項目元數據,我們將只在單一地點更新。否則,如果我們將這個元數據與所有的pdf doument索引一起存儲,我們將最終更新所有的文檔,這不是我正在尋找的方式。
請指教。
您是否試圖避免複製來減少重複數據佔用的空間量?還是你想避免保持兩個系統同步的物流? – 2009-05-07 14:40:00