2016-09-07 85 views
-1

我想讀取doc文件並從中獲取一些結果。如何讀取.doc文件並從中獲取特定的單詞php

例如: 如果我有一個文件 - FILE.DOC

,它有類似

恢復

名稱:約翰·卡特

地址:美國

我作爲一名php開發人員工作

然後我想是這樣的:

array(
'name' => john carter 
'Address' => USA 
) 

並且還拒絕從該附加信息。

是否有可能?

我已經嘗試phpoffice,但我不能得到任何相關的需要。

我們可以很容易地獲得整個文件數據,但我無法識別我想要的任何東西。

我需要的是類似於abbyy給圖像給文本。

請任何人都幫助我。

+0

爲什麼沒有任何回答這樣的反對票或評論? –

回答

1

PHP docx閱讀器:將MS Word Docx文件轉換爲文本 該類可以將MS Word Docx文件轉換爲文本。

它可以以docx格式從壓縮的Microsoft Word文件中提取文件。

該類可以解析文檔XML文件並提取它包含的文本。從問題

Refreance:https://stackoverflow.com/a/19503654/5212418

+0

你可以在這裏找到它:http://www.phpclasses.org/package/7934-PHP-Convert-MS-Word-Docx-files-to-text.html –

+0

謝謝你的回答...但對我沒有幫助因爲它提供全文而不是分離的數據。所以沒有upvoted。 –

+0

好的,你可以請告訴我你在做什麼。它更好地將文檔轉換爲文本,然後用邏輯清理 –

相關問題