2012-09-19 28 views
-3

我是MySQL新手。我正在嘗試使文本文件「機器可讀」。我有一堆文本文檔,每個文檔都包含一些元數據(如作者,文檔編號等)。此外,文本的不同部分被標記(如標題,介紹,引文,鏈接等),一些標記包含元數據(如鏈接引用)。MySQL:虛擬數據庫設計

我需要能夠通過元數據和文本搜索數據庫。此外,我需要能夠僅搜索文檔的不同部分(介紹等)。我還需要標記文本的新部分 - 添加額外的「標記」。

我很容易想象如何在xml中表示這些文檔,但是,由於我需要對這些文本執行復雜的查詢,因此將它們存儲在xml中不是可行的選項。

我想找到有關如何以不會增加額外信息(特別是「標記」)困難的方式構建模式/表的基本指針。

希望關於我想達到的內容的描述不是太模棱兩可。 非常感謝。

回答

1

您所描述的要求表明您需要的不是真正的MySQL(或任何其他供應商)關係數據庫而是Lucene索引。至少這是我用來實現類似目標的(Lucene)。

由於問題並不十分具體(請參閱https://stackoverflow.com/faq#questions),我會給你一個普遍的答案。

因此,請嘗試Solr,它是與MySQL結合的Lucene。嘗試通過本教程http://lucene.apache.org/solr/api-3_6_1/doc-files/tutorial.html

+0

@ bpgergo - 我會看看solr,謝謝。 – root