2016-10-28 101 views
-2

我有2個文件,每個具有2個字: 「WORD1」 和 「單詞2」哪個更快,XML搜索或CSV搜索詞索引?

它們是

  1. 的XML
<text> 
    <word id="word1"> 
    <file>File1Name.txt</file> 
    <file>File2Name.txt</file> 
    <file>File3Name.txt</file> 
    </word> 
    <word id="word2"> 
    <file>File1Name.txt</file> 
    <file>File4Name.txt</file> 
    </word> 
</text> 
  • A CSV文件
  • word1, File1Name.txt, File2name.txt, File3Name.txt 
    word2, File1Name.txt, File4Name.txt 
    

    假設我在這兩種格式中都有1百萬字,我必須搜索一個單詞。檢索包含該單詞的所需文件的格式會更快嗎?

    +0

    這可能值得看看http://softwareengineering.stackexchange.com/questions/224929/is-csv-a-good-alternative-to-xml-and-json – thekevshow

    +0

    已經做到了,答案是「這取決於」。這就是爲什麼我提供了我想要做什麼的背景 –

    +0

    爲什麼要使用JSON的XML? – thekevshow

    回答

    -1

    嘿,我想把我的兩分錢放在這裏。 https://github.com/elastic/elasticsearch

    是我強烈建議你看看這樣的東西。就性能而言,我會建議使用XML或CSV的JSON。但是如果你將有一百萬條記錄。像非關係數據庫的文檔存儲(如MongoDB)會爲您提供最可能的最快結果,尤其是在數據平坦的情況下。另外,如果這是你加載到內存中的東西,我會嘗試使用某種類型的緩存解決方案,讓我知道你是否有更多的問題。像redis的東西可能對你有用。 http://redis.io/topics/introduction