2012-06-26 33 views
0

我發現了一些與搜索XML相關的帖子,但這些帖子對我的任務沒有幫助。在XML文件上執行搜索的策略

我的任務是執行搜索。 來源:5-6人像,建築物,新聞等XML文件(每個類別是一個XML文件,我總共有30000個條目)。 用戶可以選擇一個類別並鍵入一些關鍵字。搜索短語應該搜索XML文件並返回結果在HTML頁面上顯示。如果用戶沒有選擇一個類別,那麼應該搜索所有的XML文件。

請告訴我最好的策略/算法來實現這個和最好的技術。

+0

這是個XML的架構?許多語言讓你解析和搜索XML:哪些是你的約束?你在尋求什麼樣的解決方案? Web應用程序?獨立?控制檯批次?哪種環境將主辦解決方案?爲什麼這些帖子沒有幫助? –

回答

1

轉換您的XML文檔(使用XSL)並將它們上傳(HTTP post)到Solr的實例。然後,您可以對索引數據執行一系列搜索操作。

Solr Wiki是目前不可用,但這裏是它的支持XML格式的例子:

<add> 
    <doc> 
    <field name="employeeId">05991</field> 
    <field name="office">Bridgewater</field> 
    <field name="skills">Perl</field> 
    <field name="skills">Java</field> 
    </doc> 
    [<doc> ... </doc>[<doc> ... </doc>]] 
</add>