1
有誰知道在.NET的API/SDK或IFilter的,可以讀取主題( '標題' 元數據)和文本從以下文件:許多文件類型的IFilter或SDK?
.PDF .DOC 。XLS .PPT 。 CSV .TXT .DOCX .XLS .PPTX + OpenOffice和Open Document標準。
開源將是很棒的...但商業也可以。
我什麼都找不到!
有誰知道在.NET的API/SDK或IFilter的,可以讀取主題( '標題' 元數據)和文本從以下文件:許多文件類型的IFilter或SDK?
.PDF .DOC 。XLS .PPT 。 CSV .TXT .DOCX .XLS .PPTX + OpenOffice和Open Document標準。
開源將是很棒的...但商業也可以。
我什麼都找不到!
我不認爲你將能夠找到一個將能夠訪問所有這些類型的內容的IFilter。通常,IFilter將用於特定技術。
例如,Adobe爲Microsoft提供了一個可以執行Word,Excel,Powerpoint,CSV(我相信它預裝了Windows)的Office。
PDF文本索引的另一種選擇是FoxIt Software。 http://www.foxitsoftware.com我發現他們的PDF IFilter比Adobe更可靠。 – dthrasher
儘管它不是一個IFilter,但我已經使用Aspose.NET來讀取文件。我想可以爲Aspose.NET製作一個IFilter包裝器。 – ben