我想從MSword 03或更舊版本獲取文本內容。有沒有可以做到這一點的腳本或軟件包?如何將舊的MS Word文檔轉換爲純文本?
我能夠從2007年文檔的文檔中獲取文本。我無法從舊版本(.doc)獲得相同的結果。
我使用apache2和php mysql。
我想從MSword 03或更舊版本獲取文本內容。有沒有可以做到這一點的腳本或軟件包?如何將舊的MS Word文檔轉換爲純文本?
我能夠從2007年文檔的文檔中獲取文本。我無法從舊版本(.doc)獲得相同的結果。
我使用apache2和php mysql。
下面是一個用於ms word文檔的PHP類,位於http://obninsk.name/obninsk_doc/。
嗨,感謝您的鏈接... –
嗨Shiven,我得到這個錯誤之後runnig,PHP類..調試錯誤:C:\ xampp \ htdocs \ mgh \ obninsk_doc.php行100 - 允許內存大小33554432字節用盡(試圖分配35個字節) 請讓我知道該怎麼辦.. !!! –
嘗試搜索此語句是否存在 ini_set('memory_limit','33M'); 然後相應地更改它 – Shiven
嘗試catdoc
,它將任何.doc文件轉換爲純文本。請參閱catdoc homepage。
您可以使用LiveDocx負責處理所有的MS Word文件包括RTF http://www.phplivedocx.org/2009/08/13/convert-docx-doc-rtf-to-html-in-php/
你怎麼從文本文件2007字? – cweiske