我是MySQL新手。我正在嘗試使文本文件「機器可讀」。我有一堆文本文檔,每個文檔都包含一些元數據(如作者,文檔編號等)。此外,文本的不同部分被標記(如標題,介紹,引文,鏈接等),一些標記包含元數據(如鏈接引用)。MySQL:虛擬數據庫設計
我需要能夠通過元數據和文本搜索數據庫。此外,我需要能夠僅搜索文檔的不同部分(介紹等)。我還需要標記文本的新部分 - 添加額外的「標記」。
我很容易想象如何在xml中表示這些文檔,但是,由於我需要對這些文本執行復雜的查詢,因此將它們存儲在xml中不是可行的選項。
我想找到有關如何以不會增加額外信息(特別是「標記」)困難的方式構建模式/表的基本指針。
希望關於我想達到的內容的描述不是太模棱兩可。 非常感謝。
@ bpgergo - 我會看看solr,謝謝。 – root