0
有沒有可以從指定的DOC或PDF文件中提取所需文本的C#庫(3.5兼容)?文本挖掘庫或算法來檢索所需的文本?
目前我搜索了約NLTP (Natural Language Text Processing),但它似乎有點困難。有沒有更簡單的解決方案?
有沒有可以從指定的DOC或PDF文件中提取所需文本的C#庫(3.5兼容)?文本挖掘庫或算法來檢索所需的文本?
目前我搜索了約NLTP (Natural Language Text Processing),但它似乎有點困難。有沒有更簡單的解決方案?
你可以學習下面這個鏈接,也可以經過Lucene.net庫
http://www.codeproject.com/Articles/9461/DotLucene-Full-Text-Search-for-Your-Intranet-or-We
Thanx!這真好 –
PDF文件是不同的;這可能需要OCR庫。即使那樣,這些也不是100%準確的。 – Makoto