對於任何輸入字符串,我們需要按任意順序通過單詞匹配查找超級字符串。即輸入字符串中的所有字都必須以輸出字符串中的任何順序出現。 例如給定數據集: 「字符串搜索」 的 「java字符串搜索」 「手冊C字符串搜索等於」 「Java的搜索代碼」 「C Java代碼搜索」 ...針對給定字符串的單詞超級字符串搜索
輸入: 「java的搜索」 輸出: 1) 「Java字符串搜索」 2) 「Java的搜索代碼」 3) 「C Java代碼搜索」
輸入: 「搜索C」 輸出: 1)「手冊C字符串搜索等於「 2)」c java代碼搜索「
這可以通過逐字匹配以非常小的方式完成。這裏主要是我正在尋找一個高效的算法。
輸入:給定數據集中的幾十億條記錄(大多數是1到10個字長的字符串)。 我需要爲數百萬個字符串找到超級字符串。 注意:單詞是擴展字典的。
你應該去正則表達式 – MeetM
正則表達式比較一個輸入字符串與所有data_set(這是數十億)是相當高的。現在我需要重新操作一百萬次(如果不是十億次)輸入字符串! – user2226441