我下載了維基百科文章標題文件,其中包含每個維基百科文章的名稱。我需要搜索所有可能匹配的文章標題。例如,我可能會有「曲棍球」一詞,但維基百科的曲棍球文章是我想要的,就是「Ice_hockey」。它也應該是一個不區分大小寫的搜索。在大文件字符串中找到部分字符串匹配的最有效方法(python)
我正在使用Python,是否有更有效的方法比只做一行行搜索?理想情況下,我將以每分鐘500或1000次的速度執行此搜索。如果一行一行是我唯一的選擇,那麼我可以在這裏做一些優化嗎?
我認爲文件中有幾百萬行。
任何想法?
謝謝。
請顯示預期的輸入。文件格式是什麼?不要讓那些想幫助你自己下載文件的人。 – aaronasterling 2011-01-29 21:46:14