2009-04-21 78 views
1

Informatica如何處理非結構化數據源(如PDF)?如果表格報告以PDF形式存儲,我們可以將它從PDF中讀出爲表格數據(如.NET中的數據表)嗎?PDF Informatica中的數據源

回答

0

PDF內部實際上是非常結構化的。最近對PDF規範的修訂可能會提供一種方法來爲外部處理準備好數據,但PDF文檔的主要目標是描述要打印的文檔,因此各種環境和設備都可以打印文檔,其結果爲儘可能相似。

它主要取決於PDF的創建者,如果提供了任何額外的數據,而不是在何處打印文本和行以形成表格。

2

的Informatica的PowerCenter非結構化數據選項

滑稽你提到它,我曾經發明瞭底層技術的初創公司工作,直到Informatica收購。

相關問題