2013-08-20 65 views
3

我正在創建一個網站,作者可以在其中創建EPUB文件。用戶將以.doc格式上傳他們的書籍。我需要創建EPUB文件。一個doc文件將有多個章節。所以我需要解析doc文件並將其分成幾章。作者將使用Heading 1作爲章節標題。是否可以使用PHP將doc文件轉換爲HTML?

所以PHP,有沒有什麼辦法來解析doc文件HTML和使用Heading 1,這樣我可以創建EPUB文件,將其分割成章節。

經過一番研究,我得到了一個linux app。但我認爲,它會將文檔轉換爲純文本。所以我將無法分割章節。

請給我一個解決方案,如果你有。提前致謝。

+0

[使用PHP創建Word,Excel和CSV文件](http://webcheatsheet.com/php/create_word_excel_csv_files_with_php.php)和[Word with php](http://www.phpdocx.com/) – Haben

+0

@HabenAmare : 謝謝。但我需要doc到html,而不是html到doc – laradev

回答

1

您可以使用PHPDOCX API來實現此目的。

首先嚐試使用this函數參考

像這樣的事情您的Word文檔生成的XHTML ..

require_once '../../classes/TransformDoc.inc'; 

$document = new TransformDoc(); 
$document->setStrFile('../files/Text.docx'); 
$document->generateXHTML(); 
$document->validatorXHTML(); 
echo $document->getStrXHTML(); 

獲得XHTML的內容,你可以做各種處理,像removing chapter等之後。

完整的文檔可以發現here

+0

它會與doc文件一起工作嗎? – laradev

+0

我嘗試過使用'docx'而不是使用'doc' – laradev

+0

您可以使用ZEND Framework嗎? –

相關問題