2013-02-04 96 views
0

我有許多單詞和excel文件,我想在這些文件的內容中搜索指定單詞(該用戶將其作爲參數提供給我的應用程序)。所以我該怎麼做?我想用C#來完成這項工作,我可以嗎?在許多word文檔文件中搜索指定的詞

我的文件內容是波斯語。

其實我想用這些文件做一個搜索引擎。

謝謝。

回答

2

看Lucene的引擎或從實現lucene in 5 min yourslef Inveted Index

例(只改爲 'PersianAnalyzer')

StandardAnalyzer analyzer = new PersianAnalyzer(Version.LUCENE_40); 
Directory index = new RAMDirectory(); 

IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_40, analyzer); 

IndexWriter w = new IndexWriter(index, config); 
addDoc(w, "Lucene in Action", "193398817"); 
addDoc(w, "Lucene for Dummies", "55320055Z"); 
addDoc(w, "Managing Gigabytes", "55063554A"); 
addDoc(w, "The Art of Computer Science", "9900333X"); 
w.close() 
+0

來這裏說Lucene的。 Lucene使這非常簡單。把你所有的文件轉儲到索引中,並且Lucene會努力工作 – devshorts

+0

Lucene支持波斯文本?你能給我一個簡單的例子嗎?謝謝 – user1793700

+0

我說我的文件每天都在更新 – user1793700