2009-10-08 58 views
1

有誰知道在.NET的API/SDK或IFilter的,可以讀取主題( '標題' 元數據)和文本從以下文件:許多文件類型的IFilter或SDK?

.PDF .DOC 。XLS .PPT 。 CSV .TXT .DOCX .XLS .PPTX + OpenOffice和Open Document標準。

開源將是很棒的...但商業也可以。

我什麼都找不到!

回答

1

我不認爲你將能夠找到一個將能夠訪問所有這些類型的內容的IFilter。通常,IFilter將用於特定技術。

例如,Adobe爲Microsoft提供了一個可以執行Word,Excel,Powerpoint,CSV(我相信它預裝了Windows)的Office。

+0

PDF文本索引的另一種選擇是FoxIt Software。 http://www.foxitsoftware.com我發現他們的PDF IFilter比Adobe更可靠。 – dthrasher

+0

儘管它不是一個IFilter,但我已經使用Aspose.NET來讀取文件。我想可以爲Aspose.NET製作一個IFilter包裝器。 – ben