2014-02-25 81 views
2

我要尋找一個面向文檔的數據庫內解決方案 - MongoDB的首選 - 索引一個不斷髮展壯大,頻繁換號的(pandoc)降價文件指數降價文件與MongoDB的

我讀到MongoDB有一個乾淨的文本索引器,但我以前沒有用過MongoDB,唯一相關的東西是我找到的預處理HTML索引過程。我正在考慮的場景是:使用markdown語法創建密鑰的降價文件的自動索引(例如,## FOOO - >header2: FOO),以及鍵/值對的層次結構保留在其中的位置文件。

這是可能的只有MongoDB或者我總是需要一個預處理,我將標記轉換爲類似BSON文件並將其攝入MongoDB?

+0

我重新提出了這個問題,以開發更強的焦點 –

回答

0

爲什麼要使用MongoDB?我認爲ElasticSearch更適合這個目的,它基本上是爲索引文本而構建的。但是 - 與MongoDB相同 - 如果您要提高查找文檔的精確度,則不會自動獲取任何內容,並且在保存文檔之前需要處理該文檔。整個文檔需要作爲JSON對象發送到ElasticSearch,但是您也可以在屬性中存儲整個未處理的降價文本。

我不確定關於MongoDB全文索引,但ElasticSearch還將文檔的所有索引屬性組合爲全文搜索。另外,您還可以定義索引中不同屬性的重要性。例如標題可能比文本的其餘部分更重要,...